Verzeichnis:Unicode

Aus Wiktionary, dem freien Wörterbuch

Für die Darstellung von Zeichen mit elektronischen Medien wurden verschiedene Zeichensätze festgelegt. Das umfangreichste System ist heute UNICODE mit derzeit 1.114.112 Codepunkten. Die Wiki-Projekte, somit auch das Wiktionary, sind im vollen Unicode geschrieben.

Für folgende Zeichensätze gibt es Übersichten:

Verzeichnisname Bereich (hexadezimal) Sprachen (Beispiele) / Anmerkungen
Basis-Lateinisch U+0000–U+007F Deutsch, Englisch, Estnisch, Finnisch, Französisch, Irisch, Italienisch, Kroatisch, Lettisch, Litauisch, Niederländisch, Norwegisch, Portugiesisch, Rumänisch, Schwedisch, Slowakisch, Slowenisch, Spanisch
Lateinisch-1, Ergänzung U+0080–U+00FF Albanisch, Dänisch, Deutsch, Estnisch, Finnisch, Luxemburgisch, Schwedisch, Slowakisch, Turkmenisch
Lateinisch erweitert-A U+0100–U+017F Tschechisch, Vietnamesisch
Lateinisch erweitert-B U+0180–U+024F Polnisch, Tschechisch
IPA Erweiterungen U+0250–U+02AF International
Abstandsmodifikatorbuchstaben U+02B0–U+02FF International
Kombinierende diakritische Zeichen U+0300–U+036F International
Griechisch und Koptisch U+0370–U+03FF Altgriechisch, Koptisch, Neugriechisch
Kyrillisch U+0400–U+052F Baschkirisch, Bulgarisch, Burjatisch, Chantisch, Dunganisch, Kasachisch, Mazedonisch, Russisch, Serbisch, Serbokroatisch, Ukrainisch, Weißrussisch
Armenisch U+0530–U+058F Armenisch
Hebräisch U+0590–U+05FF Hebräisch
Arabisch U+0600–U+06FF Arabisch
Syrisch U+0700–U+074F Syrisch
Arabisch Ergänzung U+0750–U+077F Arabisch
Thaana U+0780–U+07BF Maori
NKo U+07C0–U+07FF Bambara, Dioula, Maninka
Samaritanisch U+0800–U+083F Samaritanisch
Mandäisch U+0840–U+085F Haitianisch; erfordert speziellen Font
Syrisch Ergänzung U+0860–U+086F Syrisch; erfordert speziellen Font
Arabisch erweitert-B U+0870–U+089F Arabisch; erfordert speziellen Font
Arabisch erweitert-A U+08A0–U+08FF Arabisch; für manche Zeichen keine grafische Darstellung
Devanagari U+0900–U+097F Devanagari
Bengali U+0980–U+09FF Bengali
Gurmukhi U+0A00–U+0A7F Gurmukhi
Gujarati U+0A80–U+0AFF Gujarati
Oriya U+0B00–U+0B7F Oriya
Tamil U+0B80–U+0BFF Tamil
Telugu U+0C00–U+0C7F Telugu
Kannada U+0C80–U+0CFF Kannada
Malayalam U+0D00–U+0D7F Malayalam
Sinhala U+0D80–U+0DFF Sinhala
Thai U+0E00–U+0E7F Thai
Laotisch U+0E80–U+0EFF Laotisch
Tibetisch U+0F00–U+0FFF Tibetisch
Birmanisch U+1000–U+109F Birmanisch/Burmesisch
Georgisch U+10A0–U+10FF Georgisch
Hangeul-Jamo U+1100–U+11FF Koreanisch
Äthiopisch U+1200–U+137F Altäthiopisch, Amharisch, Tigrinya
Äthiopisch, Zusatz U+1380–U+139F Sebatbeit
Cherokee U+13A0–U+13FF Cherokee
Vereinheitlichte Silbenzeichen kanadischer Ureinwohner U+1400–U+167F Algonkin, Cree
Ogam U+1680–U+169F Ogam
Runen U+16A0–U+16FF
Tagalog U+1700–U+171F Tagalog; erfordert speziellen Font
Hanunóo U+1720–U+173F Hanunó'o; erfordert speziellen Font
Buid U+1740–U+175F Buid (auch Buhid); erfordert speziellen Font
Tagbanuwa U+1760–U+177F Tagbanuwa (auch Tagbanwa); erfordert speziellen Font
Khmer U+1780–U+17FF Khmer
Mongolisch U+1800–U+18AF Mongolisch
Unicodeblock Vereinheitlichte Silbenzeichen kanadischer Ureinwohner, erweitert U+18B0–U+18FF Algonkin, Cree
Limbu U+1900–U+194F Limbu; erfordert speziellen Font
Tai Le U+1950–U+197F Tai Nüa
Neu-Tai-Lue U+1980–U+19DF Tai Nüa
Khmer-Symbole U+19E0–U+19FF Khmer
Buginesisch U+1A00–U+1A1F Buginesisch
Lanna U+1A20–U+1AAF Tai Dam; erfordert speziellen Font
Kombinierende diakritische Zeichen, Ergänzung U+1AB0–U+1AFF International; erfordert speziellen Font
Balinesisch U+1B00–U+1B7F Balinesisch
Sundanesisch U+1B80–U+1BBF Sundanesisch; erfordert speziellen Font
Batak U+1BC0–U+1BFF Batak
Lepcha U+1C00–U+1C4F Lepcha; erfordert speziellen Font
Ol Chiki U+1C50–U+1C7F Santali
Kyrillisch erweitert-C U+1C80–U+1C8F historischer Zeichensatz; erfordert speziellen Font
Georgisch erweitert U+1C90–U+1CBF Georgisch
Sundanesisch erweitert U+1CC0–U+1CCF Sundanesisch
Vedische Erweiterungen U+1CD0–U+1CFF Schriftzeichen in den Veden
Phonetische Erweiterungen U+1D00–U+1D7F International
Phonetische Erweiterungen, Ergänzung U+1D80–U+1DBF International
Kombinierende diakritische Zeichen, Ergänzung U+1DC0–U+1DFF International
Lateinisch, weiterer Zusatz U+1E00–U+1EFF Kurmandschi
Griechisch Erweitert U+1F00–U+1FFF Altgriechisch
Allgemeine Interpunktion U+2000–U+206F International
Hoch- und tiefgestellte Zeichen U+2070–U+209F International
Währungszeichen U+20A0–U+20CF International
Kombinierende diakritische Zeichen für Symbole U+20D0–U+20FF International
Buchstabenähnliche Symbole U+2100–U+214F International
Zahlzeichen U+2150–U+218F International
Pfeile U+2190–U+21FF International
Mathematische Operatoren U+2200–U+22FF International
Sonstiges Technisches U+2300–U+23FF International
Symbole für Steuerzeichen U+2400–U+243F International
Optische Zeichenerkennung U+2440–U+245F International
Umschlossene alphanumerische Zeichen U+2460–U+24FF International
Rahmenzeichnung U+2500–U+257F International
Blockelemente U+2580–U+259F International
Geometrische Formen U+25A0–U+25FF International
Verschiedene Symbole U+2600–U+26FF International
Dingbats U+2700–U+27BF International
Verschiedene mathematische Symbole-A U+27C0–U+27EF International
Zusätzliche Pfeile-A U+27F0–U+27FF International
Braille-Zeichen U+2800–U+28FF International
Zusätzliche Pfeile-B U+2900–U+297F International
Verschiedene mathematische Symbole-B U+2980–U+29FF International
Zusätzliche Mathematische Operatoren U+2A00–U+2AFF International
Verschiedene Symbole und Pfeile U+2B00–U+2BFF International
Glagolitisch U+2C00–U+2C5F Altkirchenslawisch, Bosnisch, Bulgarisch, Kroatisch, Serbisch; erfordert speziellen Font
Lateinisch erweitert-C U+2C60–U+2C7F Uigurisch, Uralisch
Koptisch U+2C80–U+2CFF Koptisch
Georgisch, Ergänzung U+2D00–U+2D2F Georgisch (frühere Schreibweise)
Tifinagh U+2D30–U+2D7F Schrift der Tuareg aus dem Volk der Berber
Äthiopisch, erweitert U+2D80–U+2DDF Blin, Me'en, Sebatbeit; erfordert speziellen Font
Kyrillisch, erweitert-A U+2DE0–U+2DFF kombinierende Buchstaben für alte kyrillische Texte
Zusätzliche Interpunktion U+2E00–U+2E7F International; enthält weitere Interpunktionszeichen
CJK-Radikale, Ergänzung U+2E80–U+2EFF Chinesisch
Kangxi-Radikale U+2F00–U+2FDF Chinesisch
RESERVIERUNG U+2FE0–U+2FEF -
Ideographische Beschreibungszeichen U+2FF0–U+2FFF International
Wikipedia-Artikel „Unicode