UTF-8

Aus Siwecos
Wechseln zu: Navigation, Suche

UTF-8

UTF-8 steht für 8-Bit UCS Transformation Format und ist die am weitesten verbreitete Kodierung für Unicode-Zeichen. Die Kodierung wurde im September 1992 von Ken Thompson und Rob Pike festgelegt. UTF-8 ist in den ersten 128 Zeichen deckungsgleich mit ASCII und eignet sich mit in der Regel nur einem Byte Speicherbedarf für Zeichen vieler westlicher Sprachen. Im Oktober 2017 verwendeten 89,9 % aller Websites UTF-8.

Wörter und Sätze eines Textes werden aus Zeichen gebildet. Zeichen werden in einem Zeichensatz zusammengefasst, wobei alle Zeichen im Computer mittels eines Codes gespeichert werden. Es gibt es viele verschiedene Zeichensätze und Zeichenkodierungen, denken Sie nur an chinesische, japanische oder russische Schriftzeichen. Entwickler von Webseiten müssen daher sicherstellen, dass die unterschiedlichen Komponenten des Systems miteinander kommunizieren können und dass diese verstehen, welche Zeichenkodierungen verwendet werden.

Idealerweise verwendet man überall UTF-8 und vermeidet damit Probleme.


Weiterführende Links