Wiktionary:Projekt:Nichtlateinische Schrift

Aus Wiktionary, dem freien Wörterbuch

Dieses Projekt beschäftigt sich mit allen Fragestellungen und Problemen, die sich aus der Aufnahme nichtlateinischer Wörter ins Wikiwörterbuch ergeben.

Kurzanleitung[Bearbeiten]

  • Alle Wörterbucheinträge erfolgen in Originalschreibweise, z. B. 日本 (Japan) oder 中国 (China)
  • Um die Wörter auch über lateinische Tastatureingaben erreichen zu können, wird unter der lateinischen Umschrift ein Verweis auf die Originalschreibweise angelegt, z. B.
  • oder
  • Beispielseite, die sowohl Umschrifteinträge als auch normale Wörterbucheinträge enthält: hi

Nachfolgend werden die Empfehlungen verfeinert, z. B. welche Umschriftregeln angewendet werden sollen oder wie die Auflistung der Umschriftverweise (Links zur Originalschreibweise) gestaltet werden soll, damit die Einträge einerseits leicht gefunden werden können (z. B. auch ohne Eingabe von Akzentzeichen wie Hatschek) und die Liste zugleich überschaubar bleibt.


Aufgabenstellung[Bearbeiten]

Im Wikiwörterbuch werden deutsch- wie fremdsprachige Wörter aufgenommen. Alle Wörterbucheinträge erfolgen in Originalschreibweise, dies gilt auch für Wörter aus nichtlateinischen Alphabeten, da hier sonst das Problem bestünde, dass dasselbe Wort mehrfach (unter verschiedenen Umschriften) im Wikiwörterbuch eingetragen wird. Um aber auch Benutzern den direkten Aufruf nichtlateinischer Wörter zu ermöglichen, die keine Möglichkeit haben, die nichtlateinischen Zeichen einzugeben, soll ein Weg geschaffen werden, den Eintrag auch durch Eingabe der/einer Umschrift aufzufinden (lateinische Tastatureingabe).

Da unterschiedliche Wörter dieselbe Umschrift besitzen können und außerdem die lateinische Schreibweise eines nichtlateinischen Wortes in einer anderen Sprache auch als eigenes Wort bestehen kann (z. B. hi), ist diese Aufgabe nicht mit einer einfachen Weiterleitung zu lösen.

Daher kommt hier das Anlegen einer Rubrik =={Wort} ([[Hilfe:Umschrift|]]== in Frage, in der alle Wörter aufgelistet werden, die die angegebene Umschrift besitzen. Die Auflistung erfolgt unabhängig von der Sprache des jeweiligen Wortes und ohne weitere Informationen zu den einzelnen Wörtern, da diese Informationen in dem originalsprachlichen Wörterbucheintrag, auf den hier verwiesen wird, abgelegt werden. Dieser Verzicht auf die Angabe weiterer Informationen zugunsten einer möglichst knappen Auflistung ist sinnvoll, damit die Liste der mehrdeutigen Umschriften nicht mit dem Artikel selbst verwechselt wird, was dazu führen würde, dass früher oder später Informationen nicht im eigentlichen Artikel, sondern in der Übersichtsseite abgelegt werden, also wieder mehrere getrennte Artikel zum selben Wort entstehen, was das Auffinden und Beseitigen eventueller Fehler wesentlich erschwert, ohne einen angemessenen Mehrwert zu bieten.

Die Empfehlungen und noch zu klärenden Fragestellungen im Einzelnen:

Aufbau der Übersichtsseite/Übersichtsrubrik bei Mehrdeutigkeit der Umschrift[Bearbeiten]

  • Der Wörterbucheintrag zur Auflistung der Umschriften sollte in der Schreibweise der Umschrift erfolgen, allerdings ohne diakritische Zeichen, also für Zhōnggúo unter Zhongguo, da einige dieser Akzente auf älteren Rechnern nur mit großem Aufwand eingegeben werden können.
  • Alle Wörter aus irgendeiner Sprache mit nichtlateinischer Schrift, deren lateinische Umschrift (bis auf die Akzentzeichen) dieselbe Schreibweise besitzen, werden in einer eigenen Rubrik (z. B. ==Zhongguo ([[Hilfe:Umschrift|]])== in einer einzigen Liste aufgeführt.
  • In der Liste selbst wird die Schreibweise mit korrekten diakritischen Zeichen verwendet:
  • Existiert die lateinische Umschrift auch als eigenes Wort in Sprachen mit lateinischer Schrift, so werden diese anschließend als normale Wörterbucheinträge aufgeführt (z. B. ==hi ([[Sprache:Englisch|]])==)

Noch zu klären ist insbesondere:

  • Soll hinter dem Verweis eine Übersetzung angegeben werden?
    • Zhōng → (Mitte)
    • hi → (Sonne, Tag)
    • rì → (Sonne, Tag)
  • Oder soll hinter dem Verweis die jeweilige Umschrift angegeben werden?
  • Oder die Sprache, aber welche Sprache, die, in der das Zeichen existiert, oder die, in der diese Umschrift gebräuchlich ist?
    • Zhōng → (Chinesisch, Japanisch, Koreanisch, Umschrift Zhōng üblich im Chinesischen)
    • hi → (Chinesisch, Japanisch, Koreanisch, Umschrift hi üblich im Japanischen)
    • rì → (Chinesisch, Japanisch, Koreanisch, Umschrift hi üblich im Chinesischen)

Evtl. könnte man auch Sprache und Umschrift in einer kleinen Überschrift anführen. Dieser Ansatz wird z. B. bei hi verfolgt. (hi ist in allen japanischen Umschriften gleich, daher entfällt die Nennung der Umschrift.

Bisherige Beispielseiten:

Da hier die Umschrift jeweils von zentraler Bedeutung ist, sind hier auch Empfehlungen zu deren Klarheit, möglichst Eindeutigkeit auszuarbeiten:

Welche (standardisierten) Umschriften gibt es für die jeweilige Sprache?[Bearbeiten]

...und wie benennen wir die jeweiligen Glossareinträge am geschicktesten – ist Nihon zu kurz, da es zu Verwechslungen mit dem Wörterbucheintrag nihon (Umschrift von z. B. 日本) führen kann? Damit die Bezeichnungen möglichst einheitlich sind: Kommen auch die Benennungen Nihonsystem oder umgekehrt Hilfe:Hepburn-shiki in Frage?

  • Chinesisch:
    • Pinyin
  • Japanisch, Kanzi:
    • Kana (Silbenschrift)
  • Japanisch, Kana:
  • Griechisch: Transskriptionssystem aus dem Duden
  • Kyrillisches Alphabet:
    • Es gibt kein "kyrillisches Alphabet" in dem Sinne. Russisch benutzt z. B. einen anderen Zeichensatz als Serbisch. Hier ist für jedes Alphabet eine eigene Transliteration zu verwenden.
      • Russisch: es gibt aber eine Duden-Transkription, man könnte Einträge transkribiert erstellen, dort (alles in lateinischer Schrift) abhandeln. Von den Original-Kyrillisch-Einträgen aus gibt es einen Redirekt auf den Transkriptionseintrag. --acf 10:11, 15. Jan 2005 (UTC)
        • Das Lemma sollte auf jeden Fall im kyrillischen Original abgelegt werden. Die Dudentranscription kann jedoch als sinnvolle Ergänzung als eigenes Lemma angelegt werden. Anfangs vielleicht als einfacher Redirect. Falls die Transcription jedoch mehrere Begriffe (z.B. Umschrift für andere Sprachen) darstellt, wieder als normale Seite mit einem Verweis am Anfang der Seite. --Balû Diskussion 10:40, 15. Jan 2005 (UTC)
          • Oder eben halt umgekehrt von der Transkription auf das kyrillische Lemma (wenn es gewichtige Gründe gibt, die mir Menschen mit wenig Entwickler-Kenntnissen mit meinem bissel MySQL und PHP nicht geläufig sind) zeigen. --acf 10:58, 15. Jan 2005 (UTC)
  • Arabisch:
  • Hebräisch:
  • Thai-Alphabet:
    • Es gibt offizielle Richtlinien zur Transkription von Thai ins lateinische Alphabet vom Royal Institute, Bangkok, unter http://www.royin.go.th. Diese sind jedoch stark am Englisch sprechenden Leser ausgerichtet, so dass z.B. ein "ju"-Klang am Ende eines Wortes als "-ew" geschrieben wird. Die Transkription ins IPA ist deshalb empfehlenswert. Beide Möglichkeiten der Umschrift werden als interaktive Website und als Windowsprogramm von der Chulalongkorn-Universität, Bangkok, Abteilung für Linguistik, kostenlos angeboten unter http://www.arts.chula.ac.th/~ling/tts/ .

Kommentare[Bearbeiten]

  • Benennung der Glossareinträge zu den Umschriftsystemen:
    • Kunrei, Hepburn, Nihon, JSL, Pinyin
      • Kompakt
      • Einigermaßen einheitlich
        ⇒ einfach zu verwenden
      • Könnte mit entsprechenden Wörterbucheinträgen verwechselt werden, z.B. mit dem Wörterbucheintrag nihon (Umschrift von z.B. 日本). Aber es kann genausogut auch den Wörterbucheintrag Nihonsystem oder Nihon-shiki geben, wenn dies gebräuchliche Bezeichnungen sind, ist also kein KO-Argument gegen die Kurzbezeichnungen.

Wenn keine eindeutige Umschrift existiert[Bearbeiten]

  • weil mehrere mögliche Umschriftsysteme existieren:
    • Obligatorische Vorgabe der im Wikiwörterbuch zu verwendenden Umschrift?
    • Empfehlung einer im Wikiwörterbuch zu verwendenden Umschrift, aber Zulassung anderer Varianten, wobei das jeweils verwendete Umschriftsystem exakt zu spezifizieren ist?
    • Ausschließliche Vorgabe der Bedingung, dass die jeweils verwendete Umschrift exakt spezifiziert werden muss
  • weil für diese Originalschreibweise kein umfassendes Umschriftsystem existiert:
    • Zulassen unterschiedlicher Schreibweisen?

Chinesische Schriftzeichen in unterschiedlichen Sprachen[Bearbeiten]

Chinesische Schriftzeichen (Hanzi, Kanzi, Hanja) werden/wurden nicht nur in anderen asiatischen Sprachen (Japanisch, Koreanisch, Vietnamesisch(?)) verwendet, sondern besitzen dabei in den verschiedenen Sprachen (bei gleichzeitig durchaus unterschiedlicher Aussprache) oft eine übereinstimmmende oder zumindest ähnlche Bedeutung (der die Herkunft noch anzusehen ist). Wäre es da nicht sinnvoll und wünschenswert, den Wörterbucheinträgen dieser Zeichen vor den sprachspezifischen Rubriken eine allgemeine Rubrik Chinesisches Schriftzeichen voranzustellen? Etwa in der Art:

  1. Chinesisches Schriftzeichen
    Dieser Abschnitt ist immer nur bei Einträgen für ein einzelnes Schriftzeichen anzulegen, nicht bei Einträgen für Wörter, die aus mehreren Schriftzeichen bestehen, wie z.B. 日本. Im Allgemeinen kann die genaue Schreibweise und damit die Strichzahl von der Sprache abhängen. (Es gibt verschiedene Varianten: traditionell, vereinfacht, japanisch, koreanisch). Bei vielen Zeichen gibt es keinen Unterschied.
    • Allgemeine Informationen zum Schriftzeichen (Radikal (木 - Baum, Holz), Strichzahl, etc.)
    • Gemeinsame/Allgemeine Bedeutung (Wurzel, Ursprung) Keine Ahnung, ob 本 hier ein gutes Beispiel ist, ggf. durch besseres Beispiel ersetzen.
    • Ethymologische Information, z.B: Baum mit Querstrich, der auf die Wurzel hinweist.
  2. Japanisch
    • Aussprache
    • Spezielle Bedeutung (Buch) und weitere Besonderheiten im Japanischen
    • Wichtige Zusammensetzungen
    1. Substantiv hon
      • Bedeutung, Aussprache, Übersetzungen, ...
    2. Substantiv moto
      • Bedeutung, Aussprache, Übersetzungen, ...
  3. Chinesisch
    • Aussprache in den verschiedenen Dialekten
    • Spezielle Bedeutung und weitere Besonderheiten im Chinesischen...

Wenn man will kann man die Sprache in HTML angeben, wie z.B. mit: <font lang="ja">海</font> Der Browser sollte dann die passende Schrift für die Sprache verwenden.

Beispiel für Schriftvarianten
HTML-
Sprachbezeichnung
Schriftzeichen
zh-tw
zh-cn
ja
ko

zusammengesetzte Zeichen (Komposita), Radikale, ...[Bearbeiten]

sollte es dafür auf einer entsprechend zu erstellenden Vorlage nicht auch eigene Rubriken geben? bzw. sollten Komposita unter "Unterbegriffe" und Radikale unter "Herkunft" (???) ? weil ich hätte diese Informationen gerne in einem Wörterbuch. --Volvox 22:33, 26. Jun 2004 (UTC)

  • Schriftzeichen die aus zwei anderen aufgebaut sind, sind nicht notwendigerweise Unterbegriffe. Z.b. ist Rast 休 kein Unterbegriff von Mensch 人 oder Baum 木.
    Es wird bereits zu jedem Schriftzeichen das Klassenzeichen/Radikal angegeben.
    Ganze Wörter die aus mehreren Zeichen zusammengesetzt werden, z.B. 人形 könnten als Beispiele für die Verwendung der Zeichen bei allen Zeichen aus denen sie bestehen verlinkt werden. --Hokanomono 10:21, 18. Aug 2004 (UTC)

die Indizes nach Nelson oder Spahn/Hadamitzky wären zur Wiederauffindung in den entsprechenden Nachschlagewerken auch nett. Wobei ich jetzt aber nicht weiß, ob das Probleme mit dem Copyright gibt, oder ob diese Indizes einfach unter "Referenzen"/"Literatur" eingetragen werden sollten. --Volvox 22:33, 26. Jun 2004 (UTC)

  • Im Unterschied zur Wikipedia wo aus Datenbanken/Nachschlagewerken nur einzelne unzusammenhängende Einträge nachgeschlagen werden, müssen wir im Wiktionary schon eher aufpassen nicht mit dem Urheberrecht in Konflickt zu geraten. (Wenn wir also zu jedem Kanji aus einer Datenbank (z.B. einem Wörterbuch) den Nelson-Index oder ähnliches Nachschlagen könnte das ein Problem werden.) Ich kenn mich aber nicht im Detail aus. Es gibt auch relativ freie Datenbanken im Internet. --Hokanomono 10:21, 18. Aug 2004 (UTC)

Anmerkungen[Bearbeiten]

Um diesem Projekt wieder etwas Leben einzuhauchen, hier ein paar Anmerkunen zu diesem Thema:

  • Es stellt sich mir die Frage, ob wir alle Sprachen unter einen Abschnitt mit der Überschrift "Umschrift" setzen wollen oder für jede Sprache einen einzelnen Abschnitt. Im letzteren Fall würde sich ein Vorgehen wie bei den deklinierten bzw. konjugierten Formen anbieten. Das scheint aber nicht die präferierte Vorgehensweise zu sein?
  • Anderenfalls: Ein Hinweiskasten wie bei ja ist ja sehr sinnvoll, aber dieser Prototyp scheint mir etwas zu lang. Eine kurze Information wie: "Bei diesem Eintrag handelt es sich lediglich um die Umschrift. Nehmen Sie Ergänzung deshalb nur in Einträgen in der Originalschreibweise vor."
  • Außerdem würe ich eine Änderung der Angaben vorziehen: Sprache: Umschrift mit diakritischen Zeichen (falls diese erfoderlich sind) → Originalschreibwese. Auf eine Bedeutungsangabe würde ich gänzlich Verzichten. Hierfür sind die Einträge in der Originalschreibweise da.
Bei ja ergäbe dies:
    • Russisch: ja → я
    • Serbisch: ja → ја
    • Ukrainisch: ja → я
    • Weißrussisch: ja → я
und bei thea:
    • Altgriechisch: thea → θέα
    • Altgriechisch: thea → θεά
  • Nachdem wir entschieden haben, ob wir hier eine Transkription oder Transliteration angeben wollen (Ich persönlich wäre für eine Tranliteration.), müssten wir - wie bereits oben angesprochen - uns auf ein (?) System festlegen. Für die einzelnen Alphabete sollten dementsprechend Hilfeseiten (z.B. Hilfe:Umschrift Russisch) angelegt werden, auf denen in einer Tabelle die genaue Umschrift aufgeführt wird. Auf diese Seiten könnte man von Hilfe:Umschrift jeweils verweisen, auf die ja in der Infobox verwiesen wird.
Das soll es erstmal gewesen sein. Ich hoffe, dass ich hier nicht Punkte aufgegriffen habe, die schon längst geklärt waren. Aber ich denke, dass diese doch so wichtige Diskussion wiederbelebt werden sollte, da sich hier immer mehr Sprachen mit nichtlateinischen Schriftsystemen finden und finden werden. --Trevas (Diskussion) 22:37, 20. Jul 2008 (CEST)


Teilnehmer[Bearbeiten]

SteffenB, Hokanomono, Aphaea, Xenosophy

Einordnung des Projekts[Bearbeiten]

Weblinks[Bearbeiten]