In 4D speichern und arbeiten die Programmiersprache und die Datenbank-Engine nativ mit Unicode Zeichen. Das erleichtert die internationale Verwendung von 4D Anwendungen. Unicode ist ein standardisierter einheitlicher Zeichensatz, der praktisch alle gängigen Sprachen auf der Welt bedienen kann. Ein Zeichensatz besteht aus einer Tabelle, in der jedem Zeichen eine Nummer zugeordnet ist, z.B. “a”->1, “b”->2, “5”->15, “oe”->662. Während im ASCII-Code die Basiswerte zwischen 1 und 127 liegen, liegt bei Unicode die Obergrenze über 65.000. Dies bedeutet, dass praktisch jedes Zeichen aller Sprachen darstellbar ist.
Es gibt verschiedene Arten, Zahlenwerte in Unicode zu codieren: UTF-16 codiert sie in Zahlen mit 16-bit, UTF-32 in Zahlen mit 32-bit und UTF-8 in Zahlen mit 8-bit.
4D arbeitet im allgemeinen mit UTF-16, wie Windows und Mac OS. In manchen Fällen, wie z.B. für spezitische Anforderungen für das Internet, verwendet 4D den Satz UTF-8, da er kompakter und für gängige Zeichen, d.h. a-z,0-9, leichter lesbar ist.
Hinweis: 4D verwendet intern UTF-16 Codierung, um Text in Feldern und Variablen zu speichern - selbst wenn die Anwendung im Nicht-Unicode Modus läuft. Wenn nicht anders angegeben, verweist ein über die Programmiersprache verwaltetes Zeichen, eine Position oder Länge immer auf Werte in UTF-16.
Weitere Informationen über den Unicode Standard finden Sie z.B. unter:
http://en.wikipedia.org/wiki/Unicode
Die Liste der Unicode Codes unter:
http://en.wikipedia.org/wiki/List_of_Unicode_characters#See_also
Warnung: Folgende Zeichencodes sind für Unicode reserviert und dürfen nie in einen Text eingefügt werden:
0
65534 (FFFE)
65535 (FFFF)