require "/home/doms/html-guide.de/subs/www/kopf.inc.php"; ?>
Die Zeichenfolge <hallo>
im Quelltext würde als HTML-Befehl
interpretiert werden. Da es den Befehl <hallo> nicht gibt, wird
ihn der Browser ignorieren und einfach nicht darstellen. Möchte man
das Kleinerzeichen, die Textfolge hallo und das Grö&zlig;erzeichen
ausgegeben bekommen, muss man das <
-Zeichen
und das >
-Zeichen kodieren.
Wie schon im vorherigen Absatz deutlich wurde, können Zeichen der Sprache HTML nicht einfach verwendet werden. Sie würden interpretiert und nicht dargestellt werden. Um HTML-eigene Zeichen anzeigen zu können müssen diese kodiert werden:
< | < |
> | > |
" | " |
& | & |
HTML-Guide Handout |
---|
Formatierungen Aufgabenblatt 1 |
Sie kennen es vielleicht aus E-Mails. Deutsche Sonderzeichen werden oft nicht korrekt dargestellt, an deren Stelle tauchen andere Zeichenkombinationen auf. Dies liegt dann daran, dass nicht alle Systeme deutsche Sonderzeichen verarbeiten können. Bei der Sprache HTML ist dies ähnlich. Alle Browser können mit dem ASCII-Zeichensatz umgehen, der als Minimalzeichensatz zugrunde gelegt wird. Sonderzeichen müssen aus Zeichen des ASCII-Zeichensatzes zusammengesetzt werden. Für die deutschen Umlaute sieht dies wie folgt aus:
ä | ä |
Ä | Ä |
Ö | Ö |
ü | ü |
Ü | Ü |
ß | ß |
&
) folgt der Vokal (groß oder
klein, jenachde, wie der Umlaut sein soll), danach die
Zeichenfolge uml
und das Semikolon (;
).
Ab HTML 4.0 müssen die länderspezifischen Zeichen nicht
mehr kodiert werden, sofern in den Meta-Tags der Zeichensatz
angegeben wird:
Hinweis: €ltere Browser interepretieren die Zeichensatz-Informationen nicht. Aus KomatibilitŠtsgrŸnden ist deshalb die maskierte Schreibweise vorzuziehen.
<meta http-equiv="Content-Type"
content="text/html; charset=iso-8859-1">
Das Copyright- oder das Euro-Zeichen sind nur zwei Beispiele für Sonderzeichen, von denen es jede Menge gibt. Man denke nur an die Sprachbesonderheiten unsere Nachbarn. Etwa in den Skandinavischen Ländern, Frankreich, Spanien, etc. Diese lassen sich oft als leicht zu merkendes benanntes Zeichen darstellen, immer aber im eindeutigen Unicode.
€
oder ©
sind bennante
Zeichen. Ergebnis: € und ©.
Das €-Zeichen hätte man aber auch im Unicode darstellen
können, was dann wie folgt aussieht: €
.
Hierbei hat jedes Zeichen eine Nummer.
Eingeleitet wird die Darstellung mit dem Ampersand
(&
) und dem
Nummernzeichen (#
), danach folgt die Ziffer
(hier: 8364
) und abgeschlossen wird sie mit dem Semikolon
(;
).
Eine Übersicht findet sich beim World Wide Web Consortium (W3C) oder in der Zeichenreferenz von SelfHTML(s.u.).