Noch mehr Zeichen
Die Zeichen, die man mit 7 oder 8 Bit codieren kann, reichen für englische Texte oft aus. Allerdings gibt es natürlich noch Umlaute, französische Akzente, chinesische Schriftzeichen und viele Symbole, für die man gerne Codierungen hätte. Deshalb gibt es verschiedene Erweiterungen der ASCII-Tabelle.
Eine der wichtigsten Erweiterungen stellt Unicode dar. Die Unicodetabelle enthält viele tausend Zeichen, weshalb man für die Codierung eines Zeichens prinzipiell auch mehr Bits benötigt. Es gibt verschiedene Varianten der Codierung, wir betrachten hier die Variante, bei der Zeichen mit 32 Bits - also 4 Byte - gespeichert werden.
Aufgabe 1
Experimentiere mit den letzten Bits, um einige Symbole zu sehen, die in Unicode enthalten sind.
Unter Umständen siehst du kein sinnvolles Zeichen. Das kann z.B. daran liegen, dass dein
Browser nicht für alle Zeichen eine Darstellung kennt oder manche Zeichen (wie z.B.
das Leerzeichen) nicht sichtbar sind.
Experimentiere auch mit den Binärcodes
00000000000000011111011000001001
und
00000000000000000111010000110100
, indem du sie in das Feld oben kopierst und ein paar Bits am Ende variierst.