Escape-Sequenzen

Sonderzeichen, länderspezifische Zeichen, sowie Zeichen, die in der Sprache HTML selbst verwendet werden, dürfen im HTML-Dokument nicht direkt vorkommen, sondern müssen kodiert werden. Zeichen-Kodierungen beginnen mit dem Ampersand (&) und enden mit einem Semikolon (;).

<hallo>

Die Zeichenfolge <hallo> im Quelltext würde als HTML-Befehl interpretiert werden. Da es den Befehl <hallo> nicht gibt, wird ihn der Browser ignorieren und einfach nicht darstellen. Möchte man das Kleinerzeichen, die Textfolge hallo und das Grö&zlig;erzeichen ausgegeben bekommen, muss man das <-Zeichen und das >-Zeichen kodieren.

HTML-eigene Sonderzeichen

Wie schon im vorherigen Absatz deutlich wurde, können Zeichen der Sprache HTML nicht einfach verwendet werden. Sie würden interpretiert und nicht dargestellt werden. Um HTML-eigene Zeichen anzeigen zu können müssen diese kodiert werden:
< &lt;
> &gt;
" &quot;
& &amp;

HTML-Guide
Handout

HTML-Guide Download Formatierungen

HTML-Guide Download Aufgabenblatt 1

Deutsche Umlaute und das "ß"

Sie kennen es vielleicht aus E-Mails. Deutsche Sonderzeichen werden oft nicht korrekt dargestellt, an deren Stelle tauchen andere Zeichenkombinationen auf. Dies liegt dann daran, dass nicht alle Systeme deutsche Sonderzeichen verarbeiten können. Bei der Sprache HTML ist dies ähnlich. Alle Browser können mit dem ASCII-Zeichensatz umgehen, der als Minimalzeichensatz zugrunde gelegt wird. Sonderzeichen müssen aus Zeichen des ASCII-Zeichensatzes zusammengesetzt werden. Für die deutschen Umlaute sieht dies wie folgt aus:
ä &auml;
Ä &Auml;
Ö &Ouml;
ü &uuml;
Ü &Uuml;
ß &szlig;
Das System bei den Umlauten ist recht einfach zu durchschauen. Beginnend mit dem Ampersand (&) folgt der Vokal (groß oder klein, jenachde, wie der Umlaut sein soll), danach die Zeichenfolge uml und das Semikolon (;).

Ab HTML 4.0 müssen die länderspezifischen Zeichen nicht mehr kodiert werden, sofern in den Meta-Tags der Zeichensatz angegeben wird:

<meta http-equiv="Content-Type" 
content="text/html; charset=iso-8859-1">
Hinweis: €ltere Browser interepretieren die Zeichensatz-Informationen nicht. Aus KomatibilitŠtsgrŸnden ist deshalb die maskierte Schreibweise vorzuziehen.

Weitere Sonderzeichen

Das Copyright- oder das Euro-Zeichen sind nur zwei Beispiele für Sonderzeichen, von denen es jede Menge gibt. Man denke nur an die Sprachbesonderheiten unsere Nachbarn. Etwa in den Skandinavischen Ländern, Frankreich, Spanien, etc. Diese lassen sich oft als leicht zu merkendes benanntes Zeichen darstellen, immer aber im eindeutigen Unicode.

Benannte Zeichen und Unicode

&euro; oder &copy; sind bennante Zeichen. Ergebnis: und ©.
Das €-Zeichen hätte man aber auch im Unicode darstellen können, was dann wie folgt aussieht: &#8364;. Hierbei hat jedes Zeichen eine Nummer.
Eingeleitet wird die Darstellung mit dem Ampersand (&) und dem Nummernzeichen (#), danach folgt die Ziffer (hier: 8364) und abgeschlossen wird sie mit dem Semikolon (;).
Eine Übersicht findet sich beim World Wide Web Consortium (W3C) oder in der Zeichenreferenz von SelfHTML(s.u.).