Zeichenkodierung

Die Zeichenkodierung bestimmt welchen Byte-Werten welches lesbare Zeichen zugeordnet wird. Ein früher, aus dem schon von Konrad Zuse verwendeten Fernschreibcode weiterentwickelter Standard, war die 7 Bit ASCII-Zeichenkodierung (American Standard Code for Information Interchange) mit 128 definierten Zeichen, in erster Linie zur Darstellung von Schriftzeichen der englischen Sprache geeignet.

Sonderzeichen in anderen Sprachen benötigten deutlich mehr darstellbare Zeichen. So entstanden die 8 Bit Zeichensätze die 256 verschiedene Zeichen darstellen können. Da das aber auch nicht ausreicht um die spezifischen Zeichen der unterschiedlichen Sprachen darzustellen, entstanden verschiedenen Varianten der ISO-8859-Familie. Die bekannteste Variante ist ISO-8859-1, auch als Latin-1, Westeuropäisch, bekannt. Andere Varianten wären beispielsweise ISO-8859-9, Latin-5, Türkisch oder ISO-8859-5, Kyrillisch.

Sollen die spezifischen Zeichen mehrerer Sprachen gleichzeitig dargestellt werden, muss die Zeichenkodierung UTF-8, mit immerhin mehr als einer Million darstellbaren Zeichen, verwendet werden. Dazu wird in den Header der Webseite der Meta-Tag <meta http-equiv="content-type" content="text/html;charset=utf-8" /> geschrieben. Nun ist es auch nicht mehr nötig, zum Beispiel die deutschen Umlaute zu kodieren. Im Quelltext kann einfach Ä, Ö oder Ü stehen, statt &Auml;, &Ouml;, &Uuml; wie bei ISO-8859-1.

Die Seiten dieser Website sind in UTF-8 kodiert.

Weitere Begriffe aus Webdesign und Internet im Webdesign-Glossar.

Diese Seiten sind barrierefrei / barrierearm in XHTML und CSS gestaltet und nach W3C-Standard validiert: XHTML 1.0 Strict | CSS 2. © webdesign: michael rabe, Hamburg, 1999-2010. Alle Angaben nach bestem Wissen, aber ohne Gewähr. Alle Rechte vorbehalten. Alle genannten Marken sind Eigentum der jeweiligen Inhaber. Stand 01.09.2010