Los geht's: Betrachten von Unicode
Wenn Sie Unicode Viewer zum ersten Mal starten, sehen Sie ein
Fenster mit dem folgenden Inhalt:
- Ein Hauptmenü am oberen Fensterrand.
- Darunter eine Werkzeugleiste, in der die meisten
Schaltflächen ausgegraut sind.
- Eine leere Blockliste im linken Teil des Fensters.
- Eine leere Tabelle rechts daneben.
- Eine Leiste mit einer Checkbox "UTF-8" unter der Tabelle.
- Eine Lua-Konsole im unteren Teil des Fensters.
Die Anwendung lädt beim ersten Start keine Unicode-Tabelle und
diese Anleitung soll Ihnen dabei helfen eine Datei zu laden und zu
betrachten.
Benötigte Dateien
Zunächst benötigen wir eine Unicode-Tabelle in der Form einer
Textdatei. Der Anwendung sollte die vollständige Tabelle
"allkeys.txt" beiliegen. Falls dies nicht der Fall ist, können Sie
diese aus dem Internet herunterladen: http://www.unicode.org/Public/UCA/latest/allkeys.txt
.
Die Datei enthält Zeichendefinitionen für Unicode-Zeichen.
Jedes Zeichen wird definiert durch einen Code, ein Gewicht und einen
Kommentar.
Zum Beispiel: "0000 ; [.0000.0000.0000.0000] # [0000] NULL (in 6429)"
Im Beispiel ist 0000 der Code, der Teil in den eckigen Klammern das
Gewicht und alles was dem "#" folgt der Kommentar.
Die Buchstaben sind normalerweise in Blöcke einer Sprache
unterteilt. Die Blöcke sind nicht in den "allkeys" Tabellen
enthalten, sondern in einer separaten Datei "Blocks.txt". Auch diese
Datei sollte der Anwendung beiliegen, ansonsten können Sie diese
unter folgender Adresse herunterladen: http://www.unicode.org/Public/5.2.0/ucd/Blocks.txt
Bitte speichern Sie diese Datei zunächst im gleichen Verzeichnis
wie Ihre "allkeys.txt".
Die "Blocks.txt" enthält die Blockdefinitionen. Jede Definition
besteht aus einem Namen und den Blockgrenzen.
Zum Beispiel: "0000..007F; Basic Latin"
Die Zeile des Beispiels definiert den Block "Basic Latin", der alle
Zeichen mit einem Code zwischen 0000 und 007F enthält.
Laden von Unicode-Dateien
Wenn wir die beiden Dateien "allkeys.txt" und "Blocks.txt" haben,
können wir sie in das Programm laden. Die Funktion zum Laden von
Unicode-Tabellen ist in dem Menü "Datei" und in der Werkzeugleiste
(
) verfügbar.
Klicken Sie nun auf das Symbol in der Werkzeugleiste und wählen Sie
im erscheinenden Dateiauswahldialog die Datei "allkeys.txt" aus. Wenn
diese Funktion verwendet wird, überprüft die Software, ob sich
im Verzeichnis der Unicode-Tabelle auch eine Datei "Blocks.txt" befindet
und lädt sie in diesem Fall automatisch.
Wenn die Ladeoperation abgeschlossen wurde, sollte die Blockliste
Blöcke enthalten und die Tabelle sollte alle Zeichen die in
"allkeys.txt" definiert sind anzeigen.
Block-Tabellen laden
Später möchten Sie vielleicht eine andere Block-Tabelle laden,
weil sie sich zum Beispiel nicht im gleichen Verzeichnis wie die
"allkeys.txt" befindet oder um die aktuellen Blöcke zu ersetzen.
Hierfür ist die Funktion "Block-Tabelle laden" vorgesehen. Sie ist
ebenfalls über das Menü oder die Werkzeugleiste (
) verfügbar. Bei der
Verwendung werden alle aktuell geladenen Blöcke entfernt und die in
der ausgewählten Datei definierten Blöcke geladen.
Betrachten der geladenen Tabellen
Nun können wir die Zeichen in der geladenen Tabelle genauer
betrachten.
Auswählen von Blöcken
In der Blockliste können einzelne oder mehrere Blöcke
ausgewählt werden. Die Zeichen der ausgewählten Blöcke
werden in der Tabelle angezeigt. Um einen Block auszuwählen,
klicken Sie ihn mit der linken Maustaste an. Um nun der Auswahl weitere
Blöcke hinzuzufügen, halten Sie die Strg-Taste gedrückt
und klicken Sie wieder mit der linken Maustaste auf einen anderen Block.
Mit der Umschalttaste können Sie außerdem einen ganzen
Bereich von Blöcken auswählen. Wählen Sie hierzu einen
Block aus, und klicken Sie mit gedrückter Umschalttaste den Block
an, der das Ende des Bereichs darstellen soll. Beachten Sie auch den
Hinweis mit den Blockgrenzen, der auftaucht, wenn Sie ihren Mauszeiger
über einem Block positionieren. Sie können die Sortierung der Blockliste
über den Menüpunkt "Ansicht→Blöcke sortieren" festlegen.
Details zu einem Zeichen erhalten
In der Tabelle können Zeichen markiert werden. Wenn Sie ein
einzelnes Zeichen mit einem Linksklick markieren, wird die Leiste unter
der Tabelle die Zeile der Unicode-Datei anzeigen, die das Zeichen
definiert. Sie können auch die Checkbox "UTF-8" anklicken um den
Codepoint, in der UTF-8-Kodierung, in einer weiteren Leiste angezeigt zu
bekommen. Werden mehrere Zeichen in der Tabelle ausgewählt,
ähnlich wie in der Blockliste, zeigen die Detailleisten den Bereich
der Codepoints der ausgewählten Zeichen an.
Um weitere Informationen und eine vergrößerte Ansicht eines
Zeichens zu erhalten, ist es möglich in der Tabelle mit der rechten
Maustaste ein kleines Fenster zu öffnen. Es enthält die
Versionsangabe der Tabelle aus der das Zeichen geladen wurde und den
Block, dem das Zeichen zugeordnet ist. Wenn Sie die rechte Maustaste
gedrückt halten und über weitere Zeichen fahren, wird sich das
Fenster aktualisieren und jeweils das Zeichen unter dem Mauszeiger
anzeigen.
Verändern der Tabellendarstellung
Die Werkzeugleiste bietet einige Optionen um die Tabellendarstellung zu
verändern.
Sie können die Schriftart, die Schriftgröße und Fett-
oder Kursivschrift auswählen:

Es ist außerdem möglich, nur die Zellgröße zu
verändern: 
Mit dem linken Symbol vergrößern Sie die Zellen, ein Klick
auf das Rechte verkleinert diese wieder.
Am oberen Rand der Tabelle befinden sich drei Bedienelemente mit denen die
Tabelle nach einem der drei Attribute jedes Zeichens sortiert werden kann:

Mit der Auswahlbox kann das Attribut für die Sortierung bestimmt werden.
Die kleine Schaltfläche mit dem Pfeil bestimmt, ob auf- oder absteigend sortiert
werden soll (beachten Sie auch den Tooltip). Die Schaltfläche "Sortiere"
führt die Sortierung der Tabelle durch. Wenn Sie einen neuen Block auswählen,
wird die Tabelle nicht automatisch nachsortiert und Sie können so die ursprüngliche
Reihenfolge wiederherstellen.
Verschiedene Hintergrundfarben
Die Hintergrundfarbe der Zeichen wird nach folgenden Kriterien verändert:
|
Vom dem Zeichen fehlt die Kollation. |
|
Es ist kein Kommentar für das Zeichen vorhanden. |
|
Das Zeichen hat mehr als einen Codepoint. |