Wiktionary:Bots/Geplante Aufgaben

Aus Wiktionary, dem freien Wörterbuch
Zur Navigation springen Zur Suche springen

Auf dieser Seite sollen Botbetreiber ihre geplanten Aufgaben der Gemeinschaft vorstellen und eventuelle Reaktionen abwarten. Hier gibt es auch die Möglichkeit der Koordination, wenn mehrere Bots gleichzeitig ein Vorhaben bewältigen wollen. Die erste Diskussion über Botaufgaben fand hier statt: Benutzer Diskussion:BetterkBot#Neue Aufgaben.

Entfernen der Vorlagen {----} und {2x----}[Bearbeiten]

  • Vorgeschichte:
Anlass für die Entfernung war die Wortmeldung von Benutzer:Ivadon. [1]
am 18.11.2013 hat Benutzer:BetterkBot das Entfernen dieser Vorlagen per Bot angekündigt [2]. Mit dem am 24.11.2013 begonnenen Botlauf wurden sie auch tatsächlich entfernt. Am 29.11.2013 teilte Benutzer:Fisch21 mit, dass diese Vorlagen erforderlich seien [3], worauf dann deren weitere Entfernung deaktiviert wurde. Damals neigte ich zur Meinung, dass sie nötig wären. Dann gibt es dazu noch weitere Diskussionen. [4] oder [5]
  • aktuell:
Heute bin ich der Meinung, dass die beiden Vorlagen entbehrlich sind, da sie leer sind und so im Projekt nicht mehr gebraucht werden. Fisch21 meinte, dass sie für die Botprogrammierung erforderlich seien, um zum richtigen Sprachabschnitt gelangen zu können. Ich möchte kurz erklären, warum ich glaube, dass sie auch nicht für die Botprogrammierung nötig sind. Der Vorlage {{2x----}} folgt immer ein neuer Sprachabschnitt, der mit einer Überschrift der Ebene 2 beginnt, also mit zwei Gleichheitszeichen am Zeilenbeginn. Das gleiche gilt für die Vorlage {{----}} bzw. Wortartabschnitt, der immer mit einer Überschrift der Ebene 3 beginnt. Der Beginn einer solchen Überschrift ist meiner Meinung nach ein ebensoguter Bezugspunkt für die Programmierung wie die genannten Vorlagen. Der Botbetreiber Benutzer:TheIgel69 meinte hier [6], dass für die Programmierung die Vorlagen Wortart und Sprache ausreichten. Gibt es vielleicht noch andere Meinungen? Ich persönlich würde sie gerne entfernen, auch aus dem Grund, weil unsere Quelltexte auch so schon kompliziert genug sind und vor allem neue Autoren oft Probleme haben, sich darin zurechtzufinden.
--Betterknower (Diskussion) 00:26, 12. Jan 2014 (MEZ)
Pro behalten, weil:
{----} und {2x----} stechen optisch aus der sonstigen Quelltext heraus und verbessern die Übersichtlichkeit auch für Neulinge.88.68.69.29 00:51, 12. Jan 2014 (MEZ)
können beide Vorlagen eventuell auf unsichtbar gesetzt werden? Ähnlich dem Beispiel-Baustein? 88.68.69.29 00:51, 12. Jan 2014 (MEZ)
Benutzer Baisemain fragen, wie sie/ er das heute sieht 88.68.69.29 00:51, 12. Jan 2014 (MEZ)
Wenn man sich am Zweck von Vorlagen, so wie in w:Hilfe:Vorlagen angegeben, orientiert („Eine Vorlage ist eine Seite, die nach dem Transklusionsprinzip die Einbindung häufig verwendeter Elemente in andere Seiten erleichtert.“), so kann man sagen, dass Vorlagen nicht dazu da sind, die Übersichtlichkeit des Quelltextes zu verbessern.
Das zweite, von der IP oben genannte Argument verstehe ich nicht. Warum sollte man eine Vorlage, die leer ist, unsichtbar machen?
--Betterknower (Diskussion) 21:08, 23. Jan 2014 (MEZ)

Da hat jetzt die Praxis die Theorie überholt. 2016: in neuen Einträgen wird nicht mehr mit diesen beiden trennenden Vorlagen gearbeitet (meine ich). Ich persönlich lösche sie, sobald ich sie sehe. Meiner Meinung nach können die entfernt werden. Andere aktuelle Meinungen? Susann Schweden (Diskussion) 22:27, 10. Mai 2016 (MESZ)

Einfügen eines (sichtbaren) Leerzeichens[Bearbeiten]

es soll ein fehlendes Leerzeichen im Aufruf der Vorlage {{Audio}} vor '(österreichisch)' eingeschoben werden. Beispiele: Nachträge, Rennställe

--Betterknower (Diskussion) 22:08, 19. Jan 2014 (MEZ)

Wobei ich mir die Frage stelle, ob man die Parameter der Audio-Vorlage nicht überhaupt vereinfachen will, dass man nur das Sprachkürzel bzw. den Dialekt angibt, z.B. {{Audio|De-at-Nachträge.ogg|at}} oder {{Audio|En-us-example.ogg|us}}. Das ist erstens kürzer zu tippen und zweitens kann man das Aussehen zentral anpassen und nur durch Umprogrammierung der Vorlage z.B. den Dialekt mit Doppelpunkt voran- oder eingeklammert nachstellen, wie unter WT:TS#Aussehen der Audiovorlage bei Dialekten angedacht. gelbrot 16:55, 20. Jan 2014 (MEZ)
+1 Gute Idee! --Yoursmile (Diskussion) 17:44, 20. Jan 2014 (MEZ)
Gut. Seht euch mal meinen Test für eine solche Audiovorlage an: [7] und wie es im Eintrag aussehen würde: Benutzer:Betterknower/Test2
--Betterknower (Diskussion) 00:27, 21. Jan 2014 (MEZ)
Finde es auch gut. Der Titelparameter (2) wird im Normalfall in Einträgen ja nicht benötigt. Da beide Varianten dann gleichwertig funktionieren, kann man m.E. die Umstellung wenn möglich in den aktuellen Botlauf einbinden, "Extra-Edits" sollten meiner persönlichen Meinung nach unterbleiben, vorausgesetzt, man entscheidet sich nicht für die sofortige Einführung eines neuen, geänderten Layouts. Gruß gelbrot 18:00, 21. Jan 2014 (MEZ)
Nachdem ich nun so wie angekündigt in der Audiovorlage einen Sprachparameter eingeführt habe ist das Einfügen des Leerzeichens nicht mehr erforderlich. Es lässt sich per Bot auf folgende Art lösen:
{{Audio|De-at-Nachträge.ogg|Nachträge(österreichisch)}} abändern in {{Audio|De-at-Nachträge.ogg|spr=at}}
Das betrifft nicht allzu viele Einträge, in erster Linie solche zu flektierten Formen, die von Benutzer:IgelBot automatisch angelegt worden sind.
--Betterknower (Diskussion) 20:50, 23. Jan 2014 (MEZ)
Bist du dir sicher, dass nicht noch weitere Parameter notwendig sind? Ich denke an en-ca für Kanadisches-Englisch. Vielleicht sollte man auch User:Derbeth auf die Änderung hinweisen, da er gelegentlich neue Hörbeispiele hinzufügt. Schöne Grüße --Yoursmile (Diskussion) 22:46, 23. Jan 2014 (MEZ)
Ja Yoursmile, du hast recht, es gibt noch weitere Parameter, die man aber bei Bedarf jederzeit und auf einfache Weise hinzufügen kann. Gesehen habe ich da zum Beispiel regionale Sprachversionen des Französischen oder Portugiesischen.
Derbeth werde ich über die neuen Parameter informieren. Schönen Abend noch und LG --Betterknower (Diskussion) 23:21, 23. Jan 2014 (MEZ)

In meinem Bot benutze ich die folgenden Regionalkodes - das ist in keinem Fall eine komplette Liste, sondern mein subjektives Auswahl Regionalkodes, die am meisten vorkommen und relevant sind. Ich schlage vor, zumindest die Folgende Kodes zum Vorlage hinzufügen: australisch, belgisch, brasilianisch, amerikanisch Nordkalifornien. Ich werde mein Bot ändern, damit es 1) den neuen Parameter beim Hinzufügen von neuen Audios benutzt 2) das alte Form von Audio-Vorlage ins neue Form ändert, aber nur wenn vorher Audios aktualisiert wurden und wenn es sicher ist. --Derbeth talk 19:56, 24. Jan 2014 (MEZ)

Super. Ich habe nun nicht nur die vorgeschlagenen, sondern alle Regionalcodes in die Vorlage übernommen. Du beschäftigst dich ja schon lange und intensiv mit den Sprachcodes :-)
--Betterknower (Diskussion) 21:47, 24. Jan 2014 (MEZ)
D.h. der spr-Parameter ist dann anzugeben, wenn es eine Dialektaufnahme ist, andernfalls ist keine Angabe, sondern nur der pagename? Ich hätte jetzt intuitiv dann z.b. beispiel (französisch) oder beispiel (spanisch) angegeben. Aber stimmt, es macht mehr sinn, die Angabe wegzulassen, wenn es die Standardsprache betrifft (wie auch IPA etc.). Danke für die Anpassungen/Umstellungen. Bei Wiktionary:Neuerungen#Januar_2014 darauf hingewiesen. gelbrot 20:01, 25. Jan 2014 (MEZ)

Siehe Beiträge des Bots: [8] [9] [10] --Derbeth talk 17:58, 26. Jan 2014 (MEZ)

Bei Belg gibt es einen Audio-Fehler, der aber nicht von dir stammt, sondern von einem anderen Benutzer. Alles andere sieht gut aus.
Danke sagt Betterknower (Diskussion) 22:00, 26. Jan 2014 (MEZ)

Sprachspezifische Sortierung griechischer Einträge[Bearbeiten]

Wie in der Diskussion BD:Betterknower#Sortierung von griechischen Einträgen vorgebracht, sollen die griechischen Einträge um den Sortierschlüssel {DEFAULTSORT:} ergänzt werden.

--Betterknower (Diskussion) 23:15, 2. Mär. 2014 (MEZ)

ist nun erledigt, --Betterknower (Diskussion) 20:58, 5. Apr. 2014 (MESZ)

{{Beispiele fehlen}}[Bearbeiten]

BetterkBot verfügt nun über ein Skript, das in jenen Einträgen, bei denen nach :[1] kein Beispiel steht, die obige Vorlage einfügt und zwar auch mit dem entsprechenden Sprachennamen. --Betterknower (Diskussion) 20:58, 5. Apr. 2014 (MESZ)

klasse! --Susann Schweden (Diskussion) 21:07, 5. Apr. 2014 (MESZ)

deutschsprachige Einträge mit „ß“ und fehlender AS für Schweiz u. Liechtenstein[Bearbeiten]

Hallo zusammen,

als erste von mir beabsichtigte Aufgabe für den UT-Bot würde ich diesen gerne alle deutschsprachigen Einträge mit „ß“ und fehlendem AS-Baustein für Schweiz u. Liechtenstein genau diesen AS-Baustein ergänzen lassen. Es wird allerdings noch ein Weilchen brauchen, bis ich mich tiefer in die Grundlagen der Bot-Programmierung eingearbeitet habe, aber es eilt ja auch nicht. Doch die prinzipielle Vorgehensweise pro Eintrag, vor allem wo genau der AS-Baustein hingesetzt werden müsste, wäre eigentlich schon klar und ich möchte sie hiermit schon mal vorstellen und mein Vorhaben generell zur Diskussion stellen. Vielleich gibt es ja eine bessere Vorgehensweise, dann immer her mit den Vorschlägen ;o) :

  1. Gibt es den Baustein {{Alternative Schreibweisen}} schon, fehlt aber das :{{CH&LI}}, dann ergänze darunter (wo genau, wäre noch zu klären) nur das :{{CH&LI}}. Ansonsten wäre hier ohne Bearbeitung schon Schluss, da die Schreibweise für die Schweiz schon (von jemand anderem) eingetragen wurde.
  2. Wenn 1. nicht erfüllt war und auch kein Ende: Gibt es einen Baustein {{Veraltete Schreibweisen}}, dann muss der komplette AS-Baustein für die Schweiz davor gesetzt werden (danach wäre Ende).
  3. Wenn 2. nicht erfüllt war und auch kein Ende: Gibt es einen Baustein {{Nebenformen}}, dann muss der komplette AS-Baustein für die Schweiz davor gesetzt werden (danach wäre Ende).
  4. Wenn 3. nicht erfüllt war und auch kein Ende: Gibt es einen Baustein {{Worttrennung}}, dann muss der komplette der AS-Baustein für die Schweiz davor gesetzt werden (danach wäre Ende)
  5. Sollte es auch den Baustein {{Worttrennung}} nicht geben, dann würde ich sicherheitshalber einen Abbruch ohne Bearbeitung machen. Solche Einträge müsste man sich dann „von Hand“ anschauen.

Ich habe mittels einem Dump des Wiktionarys und dem AWB schon mal das Verzeichnis Benutzer:Udo T./CHuLI/Artikel ohne AS CH erstellt, das der Bot dann abarbeiten könnte. Bis es soweit ist, würde ich dieses Verzeichnis ggf. mittels einem neueren Dump nochmal aktualisieren.

Der zweite Teil wäre dann, die fehlenden Einträge mit Schweizer Schreibweise zu erstellen, die demnächst in der Kategorie:Wartung fehlende Schweizer Schreibweise gesammelt werden (siehe hierzu auch Teestube#Vorschlag für Wartungs-Kategorie Kategorie:Wartung fehlende Schweizer Schreibweise). Allerdings gehe ich mal davon aus, dass ein Bot keine Neuerstellungen durchführen darf (oder doch?) und dass man das dann eben „von Hand“ machen muss.

Gruß --Udo T. (Diskussion) 13:53, 24. Jan. 2016 (MEZ)

Bots dürfen auch neue Einträge erstellen. So hat der Benutzer:IgelBot flektierte Formen erstellt, jedoch ohne Worttrennung und Ausprache, was dann durch manuelle Nacharbeitung erledigt werden musste und meiner Meinung nach letztlich mehr Aufwand bedeutet hat, als wenn das gleich miterledigt worden wäre. -- Formatierer (Diskussion) 14:19, 24. Jan. 2016 (MEZ)
Nunja, wie ich vorhin gesehen habe, wurde die Vorlage:Schweizer und Liechtensteiner Schreibweise mittlerweile um den Abschnitt Worttrennung erweitert. Das dürfte dann wohl automatisiert sowieso kaum zu machen sein, oder? Gruß --Udo T. (Diskussion) 17:19, 24. Jan. 2016 (MEZ)
Ich glaube doch. Vor der Rechtschreibreform wäre es noch einfacher gewesen, dann hätte man einfach die Worttrennung aus dem ß-Wort unverändert übernommen. Ausgehend vom ß-Wort muss man drei Fälle unterscheiden:
1. Kein Trennzeichen vor und nach dem ß, dann unveränderte Übernahme der Worttrennung; Abschiedsgruß -> Ab·schieds·gruss
2. Trennzeichen vor dem ß, dann „·ß“ ersetzen durch „s·s“; Grü·ße -> Grüs·se
3. Trennzeichen nach dem ß, dann „ß·“ ersetzen durch „ss·“; Groß·el·tern -> Gross·el·tern
-- Formatierer (Diskussion) 13:41, 26. Jan. 2016 (MEZ)

Ich habe jetzt mal ein paar Seiten mit dem bereits existierenden Skript "replace.py" ausprobiert. Ich könnte natürlich dieses bereits bestehende Skript verwenden und das obige Szenario dann in 3 einzelnen Schritten abarbeiten:

  1. zunächst mittels aktuellem Dump und AWB eine 1. Liste erzeugen: mit ß-Einträgen ohne Baustein {{CH&LI}}, die den Baustein {{Veraltete Schreibweisen}} enthalten. Dann zuerst diese Liste mit "replace.py" abarbeiten (das dürften meiner Einschätzung nach aber nicht viele sein).
  2. dann mittels aktuellem Dump und AWB eine 2. Liste erzeugen: mit ß-Einträgen ohne Baustein {{CH&LI}} und ohne Baustein {{Veraltete Schreibweisen}}, aber mit {{Nebenformen}}. Dann diese Liste mit "replace.py" abarbeiten (dürften hauptsächlich die Genitive mit entsprechenden Nebenformen sein).
  3. zum Schluß dann eine 3. Liste erstellen; mit ß-Einträgen ohne {{CH&LI}}, {{Veraltete Schreibweisen}} und {{Nebenformen}}. Dann diese Liste mit mit "replace.py" abarbeiten (hier dürften dann die meisten Einträge enthalten sein. Da ich dann das "{{Worttrennung}}" komplett mit dem "{{Alternative Schreibweisen}}\n:{{CH&LI}} [[…]]\n\n{{Worttrennung}}" ersetzen würde, würden Einträge ohne den Baustein {{Worttrennung}} (falls es sie den gäbe) auch nicht geändert werden (obiger Punkt 5.).

Diese Vorgenensweise (step by step und ein erprobtes Skript) wäre dann sehr wahrscheinlich auch nicht so fehleranfällig... ;o)

Wenn das dann fertig wäre, dann könnte ich schauen, was noch übrig geblieben ist und wenn es eine überschaubare Menge an restlichen Einträgen mit fehlendem {{CH&LI}} wäre, dann könnte ich diesen Rest auch von Hand erledigen.

Ich bin weiterhin offen für Anregungen, Tipps und natürlich auch (konstruktiver) Kritik.

Gruß --Udo T. (Diskussion) 20:55, 25. Jan. 2016 (MEZ)


Gestern Abend habe ich die Punkte 1. und 2. schon mal erledigt. Beide mit "replace.py" und zunächst noch im manuellen Modus mit jeweiliger Bestätigung pro Eintrag. Es waren ja im 1. Schritt nur 2 Einträge und im 2. Schritt waren es auch nur überschaubare 32 Einträge, ideal also zum Testen. Ich habe es jeweils sofort kontrolliert und dann auch gleich gesichtet. Zum Schluss habe ich dann vom 3. Schritt noch 15 Einträge genommen und diese im automatischen Modus geändert. Hier hat ebenfalls alles funktioniert und auch diese 15 Einträge habe ich natürlich sofort kontrolliert und gesichtet. Es wären nun noch knapp unter 700 Einträge zu ergänzen, wobei ich allerdings Toponyme, Vor- und Nachnamen sowie Abkürzungen (ist eh nur eine) vorerst weggelassen habe, da ich mir nicht sicher bin, ob in diesen Einträgen auch ein AS-Baustein für die Schweiz reingehört. Das wäre dann ein Botlauf, der an einem Abend locker erledigt wäre.

Ich habe übrigens auch noch alle Einträge weggelassen, bei denen im Lemma die Zeichenketten "Spaß", "spaß", "Geschoß" und "geschoß" vorkommen. Hier gibt es anscheinend die Besonderheit, dass in Österreich "Geschoß" anstatt "Geschoss" und "Spass" anstatt "Spaß" verwendet wird. @Peter Gröbner: Gibt es hier evtl. in Bezug auf "ß" noch weitere Besonderheiten in Österreich?

Gruß --Udo T. (Diskussion) 10:14, 26. Jan. 2016 (MEZ)

Ich kenne nur diese beiden Fälle, wobei es kein „anstatt“, sondern ein „Geschoß, (auch): Geschoss“ bzw. „Spaß, (auch): Spass“ ist.[1] Ich persönlich bevorzuge Spaß, Erdgeschoß, aber Artilleriegeschoss. Gruß und Dank für Dein Interesse und Deine Rücksichtnahme. --Peter Gröbner (Diskussion) 12:23, 26. Jan. 2016 (MEZ)
@Udo T. Ich habe den Komplex rass/raß/räss/räß übersehen. --Peter Gröbner (Diskussion) 22:08, 26. Jan. 2016 (MEZ)
@Udo T. Ich habe auch den Ruß übersehen. Das ÖWB[1] schreibt dazu „Ruß, (auch): Russ“. --Peter Gröbner (Diskussion) 16:49, 28. Jan. 2016 (MEZ)
  1. 1,0 1,1 ÖBV im Auftrag des Bundesministeriums für Unterricht und Kulturelle Angelegenheiten (Herausgeber): Österreichisches Wörterbuch. Neubearbeitung auf der Grundlage des amtlichen Regelwerks. Schulausgabe – 38. neubearbeitete Auflage. ÖBV, Pädag. Verl., Wien 1997, ISBN 3-215-07910-0 (Bearbeitung: Otto Back et al.; Red.: Herbert Fussy)


In weiterer Vorbereitung stellt sich mir gerade die Frage, ob ich Toponyme wirklich weglassen soll oder nicht. Im Eintrag Großbritannien ist die Schweizer Schreibweise ja auch vermerkt. Und wenn ich so darüber nachdenke, macht das auch durchaus Sinn, denn wenn die Neue Zürcher Zeitung (NZZ) etwas über Großbritannien schreibt, dann wird dort im Artikel ja auch „Grossbritannien“ stehen. Warum sollte das z. B. bei Großenehrich anders sein, abgesehen von der Tatsache, dass die NZZ kaum etwas über „Grossenehrich“ zu schreiben wüsste. Wie seht ihr das? Soll der AS-Baustein für die Schweiz generell auch in Toponymen eingetragen werden?

Das Thema Vornamen hat sich bereits erledigt, denn in der Kategorie:Vorname (Deutsch) gibt es nur 2 Einträge mit „ß“ und in denen war die Schweizer Schreibweise schon vermerkt, allerdings an falscher Stelle, was ich gleich korrigiert habe.

Beim Thema Nachnamen wäre ich allerdings noch vorsichtig und würde gerne zuerst in Erfahrung bringen wollen, was die NZZ machen würde, wenn sie z. B. einen Artikel über den Politiker Bruno Ablaß schreiben würde. Oder wie würden die Schweizer Behörden denn eigentlich einen deutschen Staatsbürger mit „Weiß“ als Nachnamen behandeln, der sich in der Schweiz niederlässt? Wäre das dann für die Schweizer einfach der „Herr Weiss“? Falls ja, was macht dann der Schweizer Postbote mit Briefen aus dem Ausland, die dann evtl. an den Herrn Weiß gerichtet sind? Ist hierzu schon jemandem etwas bekannt? Im Leitfaden zur deutschen Rechtschreibung der Schweizer Bundeskanzlei konnte ich bezüglich Nachnamen nichts finden.

Gruß --Udo T. (Diskussion) 16:25, 29. Jan. 2016 (MEZ)

Ich dachte immer, dass (wegen der Schreibung in Großbuchstaben) in Österreich Familiennamen kein ß enthalten dürfen. Es scheint aber anders zu sein. Weiß jemand Genaueres? Gruß und Dank, Peter Gröbner (Diskussion) 16:56, 29. Jan. 2016 (MEZ)
Wurde nicht früher auch in Deutschland, als noch keine Unicode-Zeichensätze verwendet wurden, Umschrift für Zeichen verwendet, die hier nicht vorhanden/verwendet wurden? André -> Andre. Und macht man das nicht heute noch so bei kyrillischen, koreanischen, arabischen, ... Namen? -- Formatierer (Diskussion) 17:06, 29. Jan. 2016 (MEZ)
Und gibt es sogar ostasiatische Personennamen, die in der Originalschreibweise das Zeichen U+534D bzw. U+5350 enthalten? --84.61.149.146 17:23, 29. Jan. 2016 (MEZ)
Ich sehe (subjektiv – gefühlt) in Deutschland mehr ß, aber weniger diakritische Zeichen in Familiennamen als in Österreich. Allerdings lese ich „Die Beurkundungsdaten sind in lateinischer Schrift zu erfassen; diakritische Zeichen sind unverändert wiederzugeben. Dabei ist der Zeichensatz nach ISO/IEC 10646:2003 in der UTF-8-Kodierung zu verwenden.“ (Verordnung zur Ausführung des Personenstandsgesetzes (Personenstandsverordnung - PStV), § 15 (3)) und für Österreich „Die in diesen Familiennamen und Vornamen enthaltenen diakritischen Zeichen sind ebenfalls wiederzugeben, selbst wenn die Sprache, in der die Eintragung vorgenommen werden soll, solche Zeichen nicht kennt.“ (Rechtsvorschrift für Personenstandsbücher - Angabe von Familiennamen und Vornamen, Artikel 2)---Peter Gröbner (Diskussion) 17:11, 29. Jan. 2016 (MEZ) --Peter Gröbner (Diskussion) 17:11, 29. Jan. 2016 (MEZ)
(BK) Bei Toponymen würde ich (dem Bauchgefühl nach) differenzieren. „Großbritannien“ ist ja nicht die Eigenbezeichnung des Staates (dieser wäre Great Britain), sondern eine eigensprachliche Benennung für dieses Land. Daher wäre sie m.E. in der Schweiz Grossbritannien. Bei deutschen Städten mit ß handelt es sich aber um eine Eigenbezeichnung, die daher (auch sonst, wie Nachnamen) nicht den Rechtschreibregeln unterliegen. Daher sollten sie m.E. auch in der Schweiz mit ß geschrieben werden, Nachnamen sowieso. Ein Deutscher namens Weiss widerspricht ja auch den hiesigen Regeln und ausländische nicht-deutschsprachige Namen/Toponyme, die weitere Schriftzeichen haben, werden ja hier auch so geschrieben, auch wenn man an der Tastatur verzweifelt… grüße gelbrot 17:14, 29. Jan. 2016 (MEZ)
Bei den Nachnamen geht es momentan (Stand 16.01.16) um 6 Einträge mit „ß“: Ablaß, Bergsträßer, Floß, Groß, Prößdorf und Weiß, also eine überschaubare Menge. „Weiss“ z. B. gibt es auch hier in Vorarlberg und ganz sicherlich in der Schweiz bei Menschen, deren Vorfahren früher vielleicht sogar mal „Weiß“ hießen. Dito bei „Groß“, dort ist sogar der AS-Baustein für die Schweiz eingetragen.
Bei den Toponymen sind es derzeit (16.01.16) 80 Einträge mit „ß“. Wie ich ja bereits oben schrieb, wird die NZZ wohl kaum das „ß“ wieder einführen, wenn sie z. B. mal einen Artikel schreibt, in dem es um die bayrische Stadt Haßfurt geht, sie wird also mit Sicherheit „Hassfurt“ schreiben. Oder nehmen wir Straßburg, dort ist die Schweizer Schreibweise „Strassburg“ sogar vermerkt, die laut Eintrag auch im Elsass gültig sein soll. Im Eintrag Großglockner ist übrigens auch schon die Schweizer Schreibweise „Grossglockner“ vermerkt und dieser Eintrag auch angelegt. Gruß --Udo T. (Diskussion) 21:22, 29. Jan. 2016 (MEZ)


Nachdem der UT-Bot nun das Botflag hat, werde ich evtl. schon heute Abend eine Liste mit Verben, Adjektiven sowie deren deklinierte bzw. konjugierte Formen und den Redewendungen erstellen und diese dann abarbeiten. Dann wäre das schon mal erledigt.

OK OK Verben, Adjektive sowie deren deklinierte bzw. konjugierte Formen und Redewendungen sind erledigt, waren ca. 500 Einträge --Udo T. (Diskussion) 21:07, 1. Feb. 2016 (MEZ)

Zu den Toponymen möchte ich an dieser Stelle auch auf die Einträge Appenzell Ausserrhoden und Appenzell Außerrhoden hinweisen. In diesem Fall ist es allerdings genau umgekehrt, denn „Appenzell Ausserrhoden“ ist natürlich ein Begriff, der aus der Schweiz stammt und eigentlich müsste man sich dann auch in Deutschland und Österreich an diese Schreibweise halten. Aber der Duden kennt sogar nur die (nach der Argumentation von gelbrot eigentlich falsche) Schreibweise „Appenzell Außerrhoden“. Gruß --Udo T. (Diskussion) 10:40, 1. Feb. 2016 (MEZ)

Es ist doch so, dass es früher – als das Toponym von A und D übernommen wurde – auch in der Schweiz noch ein ß gab. „Im Bundesblatt der Schweizerischen Eidgenossenschaft fehlte nach der Umstellung von Fraktur auf Antiqua 1873 das ß zuerst, wurde aber bald darauf eingeführt, doch schon 1906 wieder aufgegeben. Der Beschluss der Zweiten Orthographischen Konferenz von 1901, ß auch für die Antiqua zwingend vorzuschreiben, fand in der Schweiz keine durchgängige Beachtung. In der Folge beschloss die Erziehungsdirektion (Kultusministerium) des Kantons Zürich in den Dreißigerjahren, das ß vom 1. Januar 1938 an in den kantonalen Volksschulen nicht mehr zu lehren; die anderen Kantone folgten. Als letzte schweizerische Tageszeitung entschied die Neue Zürcher Zeitung, die am 1. August 1946 von Fraktur auf Antiqua umgestellt hatte, ab dem 4. November 1974 auf das ß zu verzichten. Mit der Reform von 2006 wurde es auch offiziell für den amtlichen Schriftverkehr abgeschafft.“ (Deutscher Wikipedia-Artikel „ß“ (Stabilversion)) --Peter Gröbner (Diskussion) 16:46, 1. Feb. 2016 (MEZ)


Zurück zu den Toponymen: Im Wikipedia-Artikel zu ß steht auch: „Heute darf nach der deutschen Rechtschreibung im Satz das ß nur dann durch ss wiedergegeben werden, wenn in einer Schrift oder einem Zeichensatz das ß nicht vorhanden ist.“ Das bedeutet für mich aber auch, dass z. B. ein in den USA lebender Angehöriger eines Deutschen, der in „Haßfurt“ lebt, diesem einen Brief schreiben kann, in welchem im Adressfeld anstatt „Haßfurt“ eben einfach „Hassfurt“ steht. Mal abgesehen davon, dass die Post den Ort schon alleine wegen der PLZ finden wird, es bleibt erlaubt. Denn der in den USA lebende Angehörige (der vielleicht auch nicht viel Ahnung von Computern hat) ist ja nicht in der Lage das „ß“ einzutippen. Und ein Schweizer in einer vergleichbaren Situation wird wahrscheinlich schon aus Prinzip (oder Nationalstolz?) kein „ß“ verwenden wollen...

Ich würde deshalb folgenden Vorschlag machen: wir legen für die Einträge der deutschen (und ggf. natürlich auch österreichischen) Toponyme mit „ß“ zwar den Eintrag mit „ss“ an, verweisen aber im Haupteintrag nicht per „Alternative Schreibweise“ für die Schweiz und Liechtenstein auf die jeweiligen ss-Einträge. Das hätte wenigstens den Vorteil, dass eine Suche nach z. B. „Hassfurt“ dann auch zu einem Treffer führt, der dann aber auf den korrekten Eintrag mit „ß“ verweist. Nach momentanen Stand wären es 61 Einträge zu rein deutschen Toponymen mit „ß“ (siehe Kategorie:Wartung fehlende Schweizer Schreibweise), für die man dann eben nur die entsprechenden ss-Einträge anlegen würde.

Gruß --Udo T. (Diskussion) 15:48, 5. Feb. 2016 (MEZ)

Grundsätzliche Zustimmung. Bei zumindest einem der 61 der Einträge bezweifle ich die Relevanz. --Peter Gröbner (Diskussion) 17:19, 5. Feb. 2016 (MEZ)
Falls es keine Einwände zu dem Vorschlag gibt, dann werde ich das demnächst (in 2-3 Tagen) so umsetzen. --Udo T. (Diskussion) 12:21, 9. Feb. 2016 (MEZ)

Information am Rande zu österreichischen Reisepässen: „Ein scharfes "s" (ß) wird daher auch als "ß" eingetragen. Im Falle eines Namens, der ein scharfes "s" (ß) enthält, kann unter den amtlichen Vermerken im Reisepass auch ein Hinweis in Deutsch, Englisch und Französisch erfolgen, dass das scharfe "s" (ß) dem Doppel-"s" (ss) gleichzusetzen ist.“ ([11]) --Peter Gröbner (Diskussion) 16:05, 5. Feb. 2016 (MEZ)

OK OK Diese Aufgabe wäre dann vorerst soweit erledigt. Ich werde dann zukünftig immer wieder mal mit einem neuen Dump des Wiktionarys nachschauen, ob es neue Einträge gibt, bei denen der AS-Baustein für CH und LI fehlt und diese dann abarbeiten. Ich gehe mal davon aus, dass ich das dann nicht hier jedes mal neu ankündigen muss, oder doch? Die Skripte dafür habe ich und ich muss dann ja nur eine neue Liste mit den Einträgen generieren und diese dann abarbeiten. Gruß --Udo T. (Diskussion) 11:14, 11. Feb. 2016 (MEZ)

Dank, Lob und Anerkennung! --Peter (Gröbner) (Diskussion) 11:18, 11. Feb. 2016 (MEZ)

fehlende Aussprache-Bausteine ersetzen[Bearbeiten]

Hallo zusammen,

inspiriert von diesem Beitrag, habe ich mal den Datenbankscanner vom AWB mit dem neuesten Dump vom 03.02.16 bemüht und nach Einträgen mit fehlendem Aussprache-Abschnitt/Kapitel gesucht:

  • Bei den deklinierten Formen von Adjektiven u. Substantiven sowie den konjugierten Formen von Verben sind es zusammen ca. 220 Einträge
  • Bei den Haupteinträgen sind es dann schon ca. 2240 Einträge.

Falls es keine Einwände gibt, dann würde ich demnächst den UT-Bot da mal „drüberlaufen“ lassen und überall den fehlenden Aussprache-Abschnitt einfügen, also so dann:
{{Aussprache}}
:{{IPA}} {{Lautschrift|…}}
:{{Hörbeispiele}} {{Audio|}}

Dann tauchen diese Einträge zumindest auch in der Kat. für fehlende Lautschrift auf. Vorbereitet (und bereits angetestet) hätte ich alles. Es werden gemäß den beiden o. a. Punkten dann 2 Botläufe werden, da jeweils unterschiedlich gesucht und ersetzt werden muss.

Dann gab es noch ca. 115 Einträge, die zwar einen Aussprache-Abschnitt hatten und auch den Baustein {{IPA}}, hinter dem dann aber einfach nichts stand. Diese überschaubare Anzahl an Einträgen habe ich bereits heute abend entsprechend ergänzt, also das fehlende {{Lautschrift|…}} hinter {{IPA}} eingefügt.

Gruß --Udo T. (Diskussion) 23:34, 7. Feb. 2016 (MEZ)

Symbol support vote.svg Pro --Betterknower (Diskussion) 22:03, 8. Feb. 2016 (MEZ)
Symbol support vote.svg Pro --Impériale (Diskussion) 23:37, 8. Feb. 2016 (MEZ)
Symbol support vote.svg Pro --Peter (Gröbner) (Diskussion) 14:25, 9. Feb. 2016 (MEZ)

OK OK, 1. Teil erledigt, es waren insg. 211 Änderungen. Bei den Substantiven habe ich (nicht der Bot ;o), sofern möglich, mit checkpage dann auch gleich die Lautschrift ergänzt.
Abwartend Abwartend, 2. Teil voraus. nächsten Samstag: das wird ca. 6 Std. laufen und ich möchte den Bot (noch) nicht unbeaufsichtigt laufen lassen.
Gruß --Udo T. (Diskussion) 19:37, 9. Feb. 2016 (MEZ)

OK OK, 2. Teil ist auch erledigt, es wurden insg. 1917 Einträge ergänzt. Die geringere Anzahl zu oben ist einerseits damit zu erklären, dass es Einträge gab, die nach dem 06.02.16 (WT-Dump) bereits ergänzt wurden, was ja ok ist. Andererseits gibt es aber Einträge, in denen es den Bedeutungs-Baustein überhaupt nicht gibt und diese wurden deswegen vom Bot auch nicht ergänzt. Mit dem Datenbank-Scanner vom AWB habe ich insg. 522 deutschssprachige Einträge ohne den Bedeutungs-Baustein gezählt. Stellt sich nun die Frage, was wir mit diesen Einträgen machen, aber das ist dann wohl ein eigenes Thema, zu dem ich evtl. schon eine Idee hätte. Mehr dann zu gegebener Zeit in der Teestube. Gruß --Udo T. (Diskussion) 18:26, 14. Feb. 2016 (MEZ)

Gestern abend habe ich festgestellt, dass es einige (ca. 50) Beiträge gibt, in denen anstatt {{Lautschrift|…}} ein {{Lautschrift|...}} (mit drei echten Punkten) verwendet wird. Dann gibt es noch über 500 Einträge, in denen nur {{Lautschrift|}} ohne das „…“-Zeichen steht. Da das ja jetzt thematisch doch irgendwie in Zusammenhang zu der bisherigen Aufgabe steht, werde ich das demnächst (evtl. schon heute abend) korrigieren, so dass auch in dieser Beziehung ein einheitliches Erscheinungsbild bei allen Einträgen erreicht wird. Darüberhinaus erleichtert diese Korrektur evtl. spätere Bot-Läufe, wenn überall die gleiche Zeichenkette im Quelltext steht. Gruß --Udo T. (Diskussion) 12:42, 18. Feb. 2016 (MEZ)
OK OK, auch erledigt. Gruß --Udo T. (Diskussion) 23:22, 18. Feb. 2016 (MEZ)

Ähnliche Reime[Bearbeiten]

Ich möchte, dass bei allen Reimseiten, die im Quelltext eine Zeile

|Ähnliche Reime=

enthalten, diese von einem Bot entfernt wird, weil sie überflüssig ist. --84.61.158.253 21:11, 10. Mai 2016 (MESZ)

Diese Anfrage würde eigentlich erst mal auf Wiktionary:Bots/Anträge auf Bearbeitungen hingehören. Mit dem DB-Scanner vom AWB habe ich 4.080 Reim-Seiten ermittelt, die geändert werden müssten. Man könnte es aber auch schneller haben, indem man in der Vorlage:Reim Übersicht den Parameter „Ähnliche Reime“ einfach rausnimmt und schwupps, schon wären die Ähnlichen Reime auf allen Reim-Seiten verschwunden. Ok, im Quelltext würde es dann immer noch stehen, aber eine alternative (und insbesondere Ressourcen schonende) Vorgehensweise wäre das schon, oder? Aber schauen wir mal, was andere dazu zu sagen haben und ob das überhaupt von der Mehrheit so gewollt ist. Gruß --Udo T. (Diskussion) 21:34, 10. Mai 2016 (MESZ)

Ich meine, dass die Zeile

|Ähnliche Reime=

nur dann aus dem Quelltext entfernt werden soll, wenn sie unnötig ist, weil im Abschnitt „Reim“ keine Zeile „Ähnliche Reime:“ erscheint. --84.61.158.253 21:48, 10. Mai 2016 (MESZ)

Aha, also so wie bei Reim:Deutsch:-aːʒə? Falls ja, dann erübrigt sich die Anfrage meines Erachtens, denn das kann ja wohl niemanden ernsthaft stören, wenn dem Parameter einer Vorlage nichts übergeben wird. Das kommt bei anderen Vorlagen auch vor, schon alleine, weil viele eine Kopiervorlage verwenden, in der alle (wichtigen) Parameter enthalten sind, nach dem Kopieren in den Quelltext aber nur die relevanten Parameter auch eingeben. Es gilt auch hier im Wiktionary der Grundsatz, dass Änderungen am Quelltext auch zu einer sichtbaren Änderung der angezeigten Seite führen sollen (von wenigen Ausnahmen mal abgesehen). Und es wären dann übrigens immer noch 2.570 Reim-Seiten, die (m. E. sinnlos) geändert werden müssten. Von daher ein klares Symbol oppose vote.png Contra von meiner Seite. Gruß --Udo T. (Diskussion) 22:03, 10. Mai 2016 (MESZ)
das ist auch für mich primär eine rein optische Frage --> nun steht da eine Zeile, dann stünde da (im Quelltext) sozusagen keine Aufforderung mehr zur Eingabe eines Inhaltes. Faktisch ist für den Betrachter das eine so ok wie das andere. Um diese Zeile zu löschen müsste man 100% sicher sein, dass da nie etwas eingetragen werden wird. Vielleicht ist das so, weil 84.61 alles im Griff hat? Vielleicht aber nicht wirklich 'Alles', jeden einzelnen Reimeintrag? Im Reim:Namensraum gehen Profis umher, die das Thema beherrschen, dehalb ist ein leerer Parameter kein Beinbruch oder platzfressend oder irritierend. Jetzt kommt mein 'sekundäres' Argument: Wenn aber 84.61 das als störend in seiner Ordnung empfindet und er ja überwiegend hier aktiv ist, würde ich ihn noch mal fragen wollen: muss das sein? Sagt er: ja! Würde ich ihm den Gefallen tun. Es ist halt optische Ordnung im Lieblingshaushalt, ich kann das irgendwie nachvollziehen :) mlg Susann Schweden (Diskussion) 22:52, 10. Mai 2016 (MESZ)

Ich meine, dass alle leeren Unterabschnitte „-silbig“ in den Abschnitten „Reimwörter“ aller Reimseiten entfernt werden müssen. --84.61.158.253 22:32, 10. Mai 2016 (MESZ)

Ich halte Änderungen per Bot oder auch manuelle, die im Lesemodus nicht sichtbar sind, (in der Regel) für entbehrlich. Zudem kann man 'ähnliche Reime' nicht präzise definieren; es ist so wie im Abschnitt Ähnlichkeiten, wo es unterschiedliche, individuelle Ansichten geben kann.
Ich befürworte es jedoch, wenn der Anleger/Bearbeiter einer Reimseite die betreffende Zeile entfernt, wenn man mit Sicherheit annehmen kann, dass hier nie etwas ergänzt wird.
--Betterknower (Diskussion) 21:10, 11. Mai 2016 (MESZ)
Was von der IP in der obigen (eigentlich nicht hierhergehörernden) Meldung - die Entfernung der leeren Unterabschnitte betrifft: ja, die können entfernt werden (was ja auch wiederum vom Anleger der Reimseite hätte gemacht werden können). --Betterknower (Diskussion) 21:10, 11. Mai 2016 (MESZ)

Silbenzahl bei (deutschen) Reimen[Bearbeiten]

Ich möchte, dass ein Bot bei allen deutschen Reimseiten die Vokale nach dem Präfix „Reim:Deutsch:-“ zählt (als Vokale gelten [a, e, i, o, u, y, ã, õ, ø, œ, ɐ, ɔ, ə, ɛ, ɪ, ʊ, ʏ]; aus Unicode-Gründen brauchten die Lautschriftzeichen [œ̃, ɛ̃] im Gegensatz zu [ã, õ] nicht berücksichtigt werden. Außerdem gehen das Diakritikum für „silbisch“ (U+0329) positiv und die Diakritika für „unsilbisch“ (U+0306, U+0311, U+032F) negativ in die Zählung der Silben ein.

Bei englischen Reimen müssen außerdem die Vokale [æ, ɑ, ɒ, ɜ, ʌ] und eventuell [ɚ, ɝ] berücksichtigt werden; außerdem müssen bei allen Reimendungen, die mit den Diphthongen [aɪ, aʊ, eə, eɪ, oʊ, ɔɪ, əʊ, ɛə, ɪə, ʊə] bzw. deren rhotischen Varianten [eɚ, ɛɚ, ɪɚ, ʊɚ] anfangen, diese als nur ein Vokal gezählt werden, auch wenn der zweite Vokal kein Diakritikum für „unsilbisch“ trägt; für den Diphthong [oʊ, əʊ] gilt dies auch dann, wenn er an einer späteren Stelle im Reim vorkommt.

Die französischen Reime scheinen alle einsilbig zu sein; lediglich bei den Reimen, die auf „Verschluss-/Lippenzahnlaut [p, b, t, d, k, ɡ, (g), f, v] + Liquid [ʁ, (ʀ), (r), (ɾ), l]“ enden, stellt sich die Frage, ob sie zweisilbig sind.

Bei irischen Reimen müssen die Diphthonge [iə, uə, əi, əu] als einsilbig gezählt werden.

Bei isländischen Reimen müssen die Diphthonge [ai, au, ei, ou, øy] als einsilbig gezählt werden.

In einigen weiteren Sprachen kommen sogar die Vokale [ɨ, ʉ, ɯ, ɵ, ɤ] und die Nasalvokale [ẽ, ĩ, ũ] vor.

Mein Vorschlag:

Wir sollten also alle 28 IPA-Vokale, die sechs vorgefertigten Nasalvokale, sowie die beiden rhotischen Vokale (also: [iyɨʉɯuɪʏʊeøɘɵɤoəɛœɜɞʌɔæɐaɶɑɒĩỹũẽõãɚɝ] vom Bot zählen lassen; außerdem wie gesagt das Diakritikum für „silbisch“ (U+0329) positiv und die Diakritika für „unsilbisch“ (U+0306, U+0311, U+032F) negativ in die Zählung der Silben eingehen lassen.

Sonderregelungen für gewisse Sprachen:

Englisch, Irisch, Isländisch: Hier brauchen die Diakritika für „unsilbisch“ (U+0306, U+0311, U+032F) nicht negativ in die Zählung der Silben eingehen; dafür aber jedes Vorkommen von Diphthongen (Englisch: [aɪ, aʊ, eə, eɪ, oʊ, ɔɪ, əʊ, ɛə, ɪə, ʊə, eɚ, ɛɚ, ɪɚ, ʊɚ], Irisch: [iə, uə, əi, əu], Isländisch: [ai, au, ei, ou, øy]).

Französisch: Hier muss eventuell auch jede Kombination „Verschluss-/Lippenzahnlaut [p, b, t, d, k, ɡ, (g), f, v] + Liquid [ʁ, (ʀ), (r), (ɾ), l]“, die am Ende eines Reimes steht, positiv in die Zählung der Silben eingehen.

In jedem Fall darf die Zählung nur den Teil nach dem Präfix „Reim:<Sprache>:-“ betreffen. --84.61.138.217 18:18, 23. Okt. 2016 (MESZ)

Der Bot hat also in allen Reimseiten das erste Vorkommen der Zeichenkette

}}

durch

|Silbenzahl=<n>
}}

zu ersetzen, wobei <n> für die vom Bot ermittelte Silbenzahl steht. Falls vor dieser Zeichenkette bereits eine Zeile mit

|Silbenzahl=<n>

vorhanden sein sollte, überprüft er diese, und korrigiert <n> gegebenenfalls. Falls der Bot für die Silbenzahl keine positive ganze Zahl ermittelt hat, wird ein Fehler ausgegeben. Im Fall, dass die genannte Zeichenkette schon vor dem ersten Vorkommen von

== Reim ==

vorkommen sollte, z. B. weil ein Löschantrag eingebaut wurde, wird die Ersetzung stattdessen beim zweiten Vorkommen dieser Zeichenkette vorgenommen; dies betrifft aktuell wohl nur Reim:Deutsch:-ankɔmən, dessen Löschantrag seit fast zweieinhalb Jahren auf seine Entscheidung wartet. --84.61.138.217 18:39, 23. Okt. 2016 (MESZ)

Esperanto, Latein, Neugriechisch, Niederländisch und Portugiesisch habe ich wegen der geringen Anzahl der betroffenen Reime (insgesamt 13 Reime, davon höchstens 4 in jeder Sprache) per Hand erledigt. Damit hat der Botlauf also nur die Sprachen Deutsch, Englisch, Französisch, Isländisch, Italienisch, Polnisch, Russisch, Spanisch, Tschechisch und Ungarisch zu berücksichtigen (bis jetzt wurden noch keine dänischen Reime angelegt). Also kann die Zeichenkette mit den Vokalen wohl zu [iyuɪʏʊeøoəɛœɔɐaõãɜʌæɑɒɨɵʉ] vereinfacht werden ([ɵ] ist für die Lautschrift russischer Wörter mit ё nötig). --84.61.138.217 19:59, 23. Okt. 2016 (MESZ)