Zum Hauptinhalt springen

4. Unicode

Unicode ist ein internationaler Standard für Schriftzeichen und Symbole. Das Unicode-Konsortium erstellt einen Katalog von allen sinnvollen Schriftzeichen, welcher ständig erweitert wird. In der Version 40.0, welche im Oktober 2021 veröffentlicht wurde, umfasst Unicode ca. 140000140'000 Zeichen.

Hier sind ein paar Zeichen aufgeführt, um zu illustrieren wie umfangreich Unicode ist:

Jedes Unicode-Zeichen hat eine eindeutige Unicode-Nummer, welche häufig als hexadezimale Zahl geschrieben wird, aber natürlich auch dezimal oder binär dargestellt werden kann.

⭐️ Hexadezimal Zahlen

Anstatt Zahlen im Dezimalsystem oder Binärsystem zu schreiben, kann auch das Hexadezimalsystem mit 16 eindeutigen Zeichen verwendet werden. Dabei werden die zehn Zahlenziffern mit den ersten 6 Buchstaben des Alphabets ergänzt:

Hex16Hex_{16}0123456789ABCDEF
Dez10Dez_{10}0123456789101112131415
Bin2Bin_{2}0000000100100011010001010110011110001001101010111100110111101111

Jede Stelle in einer Hexadezimal-Zahl entspricht hier einer 16er Potenz:

A3D16=A162+3161+D160=10256+316+131=2560+48+13=262110\begin{aligned} A3D_{16} &= A \cdot 16^2 + 3 \cdot 16^1 + D \cdot 16^0 \\ &= 10 \cdot 256 + 3 \cdot 16 + 13 \cdot 1 \\ &= 2560 + 48 + 13 \\ &= 2621_{10} \end{aligned}

Anwendungsbereich

Das praktische bei Hexadezimalzahlen: 4 bits können mit nur einer Hexadezimalzahl geschrieben werden, was deutlich übersichtlicher wird:

11012=1310=D161101_{2} = 13_{10} = D_{16}

Ein Byte (8 bits) werden dann konventionell als zwei Hexadezimal Zahlen geschrieben:

1101 1001 = D9
F5 = 1111 1001