Unicode ist ein internationaler Standard für Schriftzeichen und Symbole. Das Unicode-Konsortium erstellt einen Katalog von allen sinnvollen Schriftzeichen, welcher ständig erweitert wird. In der Version 40.0, welche im Oktober 2021 veröffentlicht wurde, umfasst Unicode ca. Zeichen.
Hier sind ein paar Zeichen aufgeführt, um zu illustrieren wie umfangreich Unicode ist:
Quelle: UT - Unicode Table
Jedes Unicode-Zeichen hat eine eindeutige Unicode-Nummer, welche häufig als hexadezimale Zahl geschrieben wird, aber natürlich auch dezimal oder binär dargestellt werden kann.
⭐️ Hexadezimal Zahlen
Anstatt Zahlen im Dezimalsystem oder Binärsystem zu schreiben, kann auch das Hexadezimalsystem mit 16
eindeutigen Zeichen verwendet werden. Dabei werden die zehn Zahlenziffern mit den ersten 6 Buchstaben des Alphabets ergänzt:
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | |
0000 | 0001 | 0010 | 0011 | 0100 | 0101 | 0110 | 0111 | 1000 | 1001 | 1010 | 1011 | 1100 | 1101 | 1110 | 1111 |
Jede Stelle in einer Hexadezimal-Zahl entspricht hier einer 16er Potenz:
Anwendungsbereich
Das praktische bei Hexadezimalzahlen: 4 bits
können mit nur einer Hexadezimalzahl geschrieben werden, was deutlich übersichtlicher wird:
Ein Byte (8 bits) werden dann konventionell als zwei Hexadezimal Zahlen geschrieben:
1101 1001 = D9
F5 = 1111 1001
4. Unicode