Benutzer Diskussion:Instance of Bot
Abschnitt hinzufügenwieso {{Siehe auch|[[trinken]]}} ? Klappt das nicht von alleine? mlg Susann Schweden (Diskussion) 14:49, 23. Jun. 2018 (MESZ)
- Ja, das funktioniert auch von allein, geht aber auch so. Bei einigen Einträgen stand es aber auch schon vorher drin: knete. -- Formatierer (Diskussion) 15:28, 23. Jun. 2018 (MESZ)
- ich nehme es immer raus, wenn ich darauf treffe :) Ich dachte das ist ein Überbleibsel von früher, wo die Software das noch nicht konnte. mlg Susann Schweden (Diskussion) 15:31, 23. Jun. 2018 (MESZ)
- Ich finde es besser, wenn es drinsteht. Das erleichtert weitere Ergänzungen. Außerdem schreibe ich es auch manchmal rein, wenn das unter Siehe auch genannte Wort noch nicht erstellt ist. --Seidenkäfer (Diskussion) 16:12, 23. Jun. 2018 (MESZ)
- Wenn es nicht drinsteht, muss die Software bei jedem Seitenaufruf immer erst prüfen, ob ein entsprechender Eintrag existiert. Das macht sie mit #ifexist, was als expensive parser function zählt. -- Formatierer (Diskussion) 16:33, 23. Jun. 2018 (MESZ)
- überzeugt. mlg Susann Schweden (Diskussion) 17:39, 23. Jun. 2018 (MESZ)
- Wenn es nicht drinsteht, muss die Software bei jedem Seitenaufruf immer erst prüfen, ob ein entsprechender Eintrag existiert. Das macht sie mit #ifexist, was als expensive parser function zählt. -- Formatierer (Diskussion) 16:33, 23. Jun. 2018 (MESZ)
- Ich finde es besser, wenn es drinsteht. Das erleichtert weitere Ergänzungen. Außerdem schreibe ich es auch manchmal rein, wenn das unter Siehe auch genannte Wort noch nicht erstellt ist. --Seidenkäfer (Diskussion) 16:12, 23. Jun. 2018 (MESZ)
- ich nehme es immer raus, wenn ich darauf treffe :) Ich dachte das ist ein Überbleibsel von früher, wo die Software das noch nicht konnte. mlg Susann Schweden (Diskussion) 15:31, 23. Jun. 2018 (MESZ)
Plural als „siehe auch“
[Bearbeiten]Ist das nicht redundant. Gruß und Dank für deine Arbeit, Peter -- 16:38, 15. Jul. 2018 (MESZ)
Super …
[Bearbeiten]… diese Anagramme! Danke, Peter -- 19:11, 18. Aug. 2019 (MESZ)
@Seidenkäfer: Mir gefällt es auch mit Beistrich besser, ich fürchte aber, er ist optional, da die Infinitivgruppe von einem Verb abhängt. Gruß euch beiden, Peter -- 16:26, 29. Okt. 2019 (MEZ)
Reim:Deutsch:-iː
[Bearbeiten]Kannst Du für die diesbezüglichen Reimwörter, wie sie aktuell zahlreich von Trevas erstellt, von Udo mit Lautschriftangabe versehen und oft von mir in der Reimseite eingetragen werden, auch automatisch in der Pluralreimseite, so der Plural existiert, diesen ergänzen? Gruß und Dank für die -ieren…-Lösung, Peter -- 12:43, 22. Mär. 2020 (MEZ)
Analoges wäre auch bei Substantiven auf -ismus, -on und -ose nützlich. Gruß aus der Reimergänzungsfabrik, Peter -- 07:43, 23. Mär. 2020 (MEZ)
- Wunsch erfüllt. -- Formatierer (Diskussion) 09:54, 26. Mär. 2020 (MEZ)
- Nun, nützlich wäre es auch, wenn es für alle flektierten Formen funktionieren würde. -- Formatierer (Diskussion) 08:52, 23. Mär. 2020 (MEZ)
- Ist das nicht das? -- Peter -- 12:04, 25. Mär. 2020 (MEZ)
- Nicht ganz, in dem von dir verlinkten Hinweis muss der Reimende noch jeden Reim einzeln anklicken und ggf. sogar selbst die Silbenanzahl ermitteln. Hier geht es doch um einen Bot, der sich selbst einen Reim auf die jeweilige Grundform macht. ;) -- Formatierer (Diskussion) 12:27, 25. Mär. 2020 (MEZ)
- Ist das nicht das? -- Peter -- 12:04, 25. Mär. 2020 (MEZ)
- Nützlich wäre es auch, wenn die Ersteller oder Aussprachevervollständiger von Einträgen mit beliebten Reimen diese gleich angeben oder die Massenreimseiten, die vor allem von Alexander, dem Seidenkäfer und mir gewartet werden, wieder abgeschafft würden. Gruß, Peter -- 11:57, 25. Mär. 2020 (MEZ)
- Versammlungsverbot für größere Gruppen von Reimen in Zeiten der COVID-19-Pandemie? Hm, ich weiß nicht. -- Formatierer (Diskussion) 12:27, 25. Mär. 2020 (MEZ)
- Ist ja nur gut, wenn wenigstens einer in diesen Zeiten Humor bewahrt! Oder war Peters Einwurf auch ein solches Zeichen? Aber vielleicht hülfe ein Brainstorming weiter, wie die Zuordnung zur Silbenanzahl in der Reimseite gewährleistet werden könnte? Erster Vorschlag: derjenige, der den Reim in der Aussprache einträgt, gibt auch die Silbenanzahl an. Denn das muss man sich ohnehin überlegen, wenn man die Reimseite vervollständigen will. Grüße, Alexander Gamauf (Diskussion) 15:04, 25. Mär. 2020 (MEZ)
- Versammlungsverbot für größere Gruppen von Reimen in Zeiten der COVID-19-Pandemie? Hm, ich weiß nicht. -- Formatierer (Diskussion) 12:27, 25. Mär. 2020 (MEZ)
Neue Anregung: -at → -ate (bei Adjektiven wie desolat gibt es noch weitere flektierte Formen). Gruß, Peter -- 10:22, 9. Apr. 2020 (MESZ)
Neue Anregung: -aɪ̯ → -aɪ̯ən. Gruß und Dank für die fleißige Arbeit, Peter -- 11:38, 14. Apr. 2020 (MESZ)
- Das ist schon längst erledigt. -- Formatierer (Diskussion) 19:14, 14. Apr. 2020 (MESZ)
- Ups. Ich hatte es umseitig nicht entdeckt.
- Neue Anregung: oːʁɪʃ → Flexionsformen, z. B. oːʁɪʃɐ. Gruß und Dank (Brauchen Bots einen Mundschutz – sie arbeiten ja ohnehin mit maskierten Zeichen?), Peter -- 09:29, 15. Apr. 2020 (MESZ)
- Die Reime der Form Langvokal + Konsonant + isch sind bereits auf meiner Arbeitsliste. Vielleicht ist ein Mundschutz - im Sinne von Redeverbot - für Social Bots ein Thema, damit nicht so viele Fakenews verbreitet werden. -- Formatierer (Diskussion) 13:01, 15. Apr. 2020 (MESZ)
Restbestand an Übersetzungen ins Deutsche
[Bearbeiten]Du schreibst „Zurück bleibt ein Restbestand von etwa 3000 Einträgen, die zu individuell gestaltet sind, um sie per Bot zu bearbeiten.“
Kannst Du eine Liste zur Verfügung stellen oder gibt es sie schon? Ich habe mit meiner laienhaften Methode (insource:/de\}\} \[.\] \[\[/
) nur 8 Fälle gefunden. 6 davon habe ich bearbeitet, 2 zu Deiner Info gelassen.
Gruß und Dank für Deine fleißige Arbeit, Peter -- 07:18, 6. Apr. 2020 (MESZ)
- Das Suchen mit regulären Ausdrücken ist manchmal etwas tricky, da man nicht nach Zeilenenden suchen kann - zumindest weiß ich nicht, wie das hier geht. Versuche es einmal damit:
hastemplate:"de" insource:/\{\{de\}\}[^=*]*\[\[/
Das hastemplate schränkt die Suche ein auf Einträge, die die Vorlage {{de}} enthalten, um nicht ins Timeout zu laufen.
Das \{\{de\}\} sucht nach dem Anfang der Vorlage in der Seite.
Das [^=*]* findet alle Zeichen bis auf '=' oder '*'. (Mit '*' beginnt die nächste Zeile oder mit '|Ü-rechts=')
Gefolgt von \[\[ zwei sich öffnenden Verlinkungsklammern.
Damit sollten die meisten Einträge gefunden werden können, es sei denn diese sind völlig schräg formatiert. -- Formatierer (Diskussion) 07:58, 6. Apr. 2020 (MESZ)
- Danke! Das mit den Zeilenenden nervt mich auch immer wieder mal. Vielleicht weiß das Perfekte Chaos Rat. Es wird wohl noch eine Weile dauern, bis ich bei Dir Lehrlings-, geschweige denn Gehilfenstatus erlange. Gruß, Peter -- 08:04, 6. Apr. 2020 (MESZ)
- Habe ich wieder mal männlichen Tunnelblick oder sind auch falsch-positive (estar) darunter? Das würde die Arbeit ja reduzieren. Gruß, Peter -- 09:49, 6. Apr. 2020 (MESZ)
- Das ist ein Beispiel für die oben erwähnten schrägen Einträge. Da in der letzten Übersetzungstabelle der Seite nur ein einziger 'de' Eintrag vorhanden ist, fehlt in der nächsten Zeile das beginnende '*'. Da außerdem '|Ü-rechts=' fehlt, gibt es keine 'Notbremse' für das fehlende Zeilenende und der reguläre Ausdruck matcht die eckigen Klammern aus dem Kategoriebereich. Man kann aber nicht das '}}'-Ende von der Ü-Tabelle prüfen, da '}}' auch innerhalb der Übersetzungszeile vorkommen kann. '*' und '=' sind die einzigen sinnvoll benutzbaren Zeichen, die nicht innerhalb der Übersetzungszeile vorkommen sollten. Von Ausnahmen mal abgesehen. -- Formatierer (Diskussion) 10:29, 6. Apr. 2020 (MESZ)
- Was ich tun kann, soll gern geschehen.
- Aber dazu müsstet ihr mir als Außenseiter in Alltagssprache schildern, was genau ihr vorhabt.
- Nach welchen Seiten sucht ihr, aber welche Treffer wollt ihr dabei nicht haben?
- LG --PerfektesChaos (Diskussion) 14:06, 7. Apr. 2020 (MESZ)
- Meine konkrete Frage war, ob man mit regulären Ausdrücken nicht doch nach Zeilenenden im Quelltext suchen kann. Gruß und Dank für Deine Nachfrage, Peter -- 14:08, 7. Apr. 2020 (MESZ)
- Info: Im DB-Scanner vom AWB kann man das. Dazu müssten wir aber den nächsten Dump abwarten. Gruß --Udo T. (Diskussion) 14:11, 7. Apr. 2020 (MESZ)
- Meine konkrete Frage war, ob man mit regulären Ausdrücken nicht doch nach Zeilenenden im Quelltext suchen kann. Gruß und Dank für Deine Nachfrage, Peter -- 14:08, 7. Apr. 2020 (MESZ)
- Mit Dumps geht alles, aber wie ihr merkt sind sie nicht live, können nur von dem einen armen Unglücksraben ausgewertet werden und müssen permanent aktualisiert werden, um den Erfolg zu überwachen.
- Es gibt aber eine Reihe von Live-Möglichkeiten bis hin zur Wartungskat.
- Zeilenumbrüche lassen sich deshalb nicht detektieren, weil sie bei der Bildung des ausgewerteten Textbestandes normalisiert werden; was sinnvoll ist, weil sie sonst bei jeder Suche einzeln von jedem Suchenden berücksichtigt werden müssten.
- Die RegExp-Sprache von Cirrus ist sehr leistungsfähig, wenn sie nicht gerade per Timeout abgeschossen wird.
(\{\{[^}]+\}\})*
(ungetestet) sollte beliebig viele innere Vorlageneinbindungen ignorieren, wenn ich euer angedeutetes Problem richtig verstanden habe.
- Realisierung durch Lua ist ein sehr wirksamer Weg, alle Parameterwerte innerhalb einer Einbindung zu analysieren, und dann ggf. auf Jahre hinaus Wartungskats zu werfen.
VG --PerfektesChaos (Diskussion) 19:38, 7. Apr. 2020 (MESZ)
Falsche Verlinkung
[Bearbeiten]Hallo Formatierer, ist es möglich, deinem Bot beizubringen, das er alles, was in den Kursiv-Markern ''…'' im Übersetzungsabschnitt steht, unberührt zu lassen? Siehe das hier. — Lieben Gruß, Caligari ƆɐƀïиϠႵ 18:11, 7. Feb. 2021 (MEZ)
- Ja, das geht natürlich. Aber da die verlinkte Änderung eine Einmal-Aktion war, ist es nun zu spät dazu. In eventuellen zukünftigen Aufträgen kann ich es berücksichtigen. -- Formatierer (Diskussion) 07:46, 8. Feb. 2021 (MEZ)
hi, fyi
Ähnliche Wörter (Deutsch):
wurde gerade entfernt. mlg Susann Schweden (Diskussion) 17:41, 22. Apr. 2021 (MESZ)
- Ja, und wer hats erfunden? -- Formatierer (Diskussion) 13:31, 3. Mai 2021 (MESZ)
- ich :) !! mlg Susann Schweden (Diskussion) 17:17, 3. Mai 2021 (MESZ)
Geburtstag
[Bearbeiten]Hallo Bot, du bist ja gestern drei Jahre alt geworden. Herzlichen Glückwunsch nachträglich. -- Formatierer (Diskussion) 10:41, 22. Mai 2021 (MESZ)
- Danke, aber typisch, dass du nicht gleich dran denkst. -- Instance of Bot (Diskussion) 10:42, 22. Mai 2021 (MESZ)
- In Österreich darf man gratulieren, solange das Geburtstagskind noch kein Kraut gegessen hat. Das ist ja bei dir wohl nicht der Fall. Also: Herzlichen Glückwunsch , Peter, 11:06, 22. Mai 2021 (MESZ)
- Andere Länder, andere Sitten. Danke, doch ist es strenggenommen auch kein Geburts- oder besser Schöpfungstag?, sondern der Anmeldetag, der sich zum dritten Mal gejährt hat. -- Instance of Bot (Diskussion) 12:49, 22. Mai 2021 (MESZ)
- Warst Du vorher in einer Embryonalphase? --Peter, 16:27, 22. Mai 2021 (MESZ)
- Andere Länder, andere Sitten. Danke, doch ist es strenggenommen auch kein Geburts- oder besser Schöpfungstag?, sondern der Anmeldetag, der sich zum dritten Mal gejährt hat. -- Instance of Bot (Diskussion) 12:49, 22. Mai 2021 (MESZ)
- In Österreich darf man gratulieren, solange das Geburtstagskind noch kein Kraut gegessen hat. Das ist ja bei dir wohl nicht der Fall. Also: Herzlichen Glückwunsch , Peter, 11:06, 22. Mai 2021 (MESZ)
Die Zahl 1 reimt sich auf Diener?
[Bearbeiten]… und ist neunsilbig? Siehe Spezial:Diff/8536835. Ich bitte den Meister, ggf. ein ernstes Wort mit dem Gehilfen zu sprechen. Peter, 09:26, 13. Okt. 2021 (MESZ)
Ich hab sie mal von der Reimseite genommen und hoffe, dass es sich um keinen systematischen Fehler handelt. Gruß an den Meister, Peter, 09:32, 11. Dez. 2021 (MEZ)
- Das war wohl ein Copy&Paste-Problem. -- Formatierer (Diskussion) 10:11, 11. Dez. 2021 (MEZ)
fehlende Reimwörter mit angegebenem Reim auf den Reimseiten
[Bearbeiten]Ich drücke bisweilen Check auf Reimseiten, um gegebenfalls fehlende Schreibungen zu ergänzen. Dabei bekomme ich immer wieder Einträge angezeigt, in denen der Reim vermerkt ist, die aber nicht auf der Reimseite eingetragen sind. Ist es sinnvoll, in diesen Fällen die Reimseite manuell zu ergänzen oder würde das der Bot eh gelegentlich machen? Grüße, Peter, 09:46, 13. Dez. 2021 (MEZ)
- Außerhalb der Aktivitäten zu flektierten Formen schaut der Bot nur nach Einträgen mit Lautschrift, auf deren Seite noch kein Reim eingetragen ist und sucht dann nach einer passenden Reimseite um das Wort dort hinzuzufügen oder weiteren passenden Wörtern, um ggf. eine neue Reimseite zu erstellen. Das Ergebnis wird mir dann vorgeschlagen und ich muss es „freigeben“. Der Fall Butanal wäre also nicht entdeckt worden, weil gar nicht danach gesucht wird. -- Formatierer (Diskussion) 16:49, 13. Dez. 2021 (MEZ)
- Mir ist eben aufgefallen, dass beim Schluf trotz Deiner emsigen Aktivitäten kein Reim eingetragen ist, obwohl die Lautschrift schon lange angegeben ist. Liegt das am „fehlenden“ Betonungszeichen ob der Einsilbigkeit? Peter, 11:37, 4. Jan. 2022 (MEZ)
- Nein, daran liegt es nicht. Es hat bei Schlufs ja auch funktioniert. Ich habe es beim Zusammenstellen der Arbeitsliste schlichtweg übersehen. -- Formatierer (Diskussion) 17:22, 4. Jan. 2022 (MEZ)
- Mir ist eben aufgefallen, dass beim Schluf trotz Deiner emsigen Aktivitäten kein Reim eingetragen ist, obwohl die Lautschrift schon lange angegeben ist. Liegt das am „fehlenden“ Betonungszeichen ob der Einsilbigkeit? Peter, 11:37, 4. Jan. 2022 (MEZ)
… wurde am 28. März 2021 um 07:10 auf der Reimseite trotz m. E. Zweisilbigkeit und Anfangsbetonung als einsilbig eingetragen. Handelt es sich dabei um einen systematischen Fehler? Gruß an Deinen Schöpfer, Peter, 12:51, 11. Feb. 2022 (MEZ)
- Ja, das ein systematischer Fehler. Da der Bot den Laut [æ] nicht als Vokal erkennt. -- Formatierer (Diskussion) 15:28, 11. Feb. 2022 (MEZ)
Ziffern als Schreibung
[Bearbeiten]Checkpage moniert das Fehlen von 4 und C4 beim Reim:Deutsch:-iːɐ̯. Ich bezweifle, dass das sinnvolle Reimwörter sind. Gruß auch an Deinen Meister, Peter, 10:01, 20. Feb. 2022 (MEZ)
- 1, 2 oder 3… Du musst Dich entscheiden, 3 Felder sind frei… Ich habe mich entschieden die 4 zu entfernen. -- Formatierer (Diskussion) 17:35, 21. Feb. 2022 (MEZ)
Homophone
[Bearbeiten]Lieber Formatierer, das ist ein wunderbarer Bot! Ich bin neulich darauf gestoßen, dass Peter das Homophon bei einreitest und einreihtest jeweils von Hand ergänzt hat (vielen Dank dafür!). Es gibt jedoch soviele, wir werden die niemals alle manuell ergänzen können bei den vielen Kombinationsmöglichkeiten, die wir inzwischen haben. Heute morgen bin ich beispielsweise auf das Fehlen bei Kot und Code gestoßen (das englische Wiktionary hat es aufgeführt, siehe Kot und Code und ich habe verglichen …). Als auditiver Mensch empfinde ich dieses Fehlen als Makel. Ist es möglich, könntest Du Deinen Bot, der ja in derselben Zeile die Ähnlichkeiten ergänzt, um diese Funktionalität erweitern? Könnte irgendjemand etwas dagegen haben (mir persönlich fällt zwar nichts ein, aber das liegt bestimmt nur an meiner beschränkten Phantasie :-))? Was sagt Udo dazu? Liebe Grüße --Jeuwre (Diskussion) 13:11, 26. Feb. 2022 (MEZ)
- Ich hatte auch schon daran gedacht, die Sache aber für so kompliziert gehalten, dass ich von einer Anfrage Abstand genommen habe. Oder unterschätze ich die Fähigkeiten des Bots und seines Meisters? Gerade die Homophone, an die man als (im Süden des Sprachraums aufgewachsener) Mensch nicht sofort denkt (tot, Tod) sind doch die interessantesten. Gruß euch beiden, Peter, 13:15, 26. Feb. 2022 (MEZ)
- Also ich hätte nichts dagegen. Wenn es machbar ist, nur zu... ;o) Gruß --Udo T. (Diskussion) 13:15, 26. Feb. 2022 (MEZ)
- Also grundsätzlich machbar ist das schon, aber es sind zurzeit auf die Schnelle ausgewertet über 50.000 Fälle betroffen. Dabei sind auch alle flektierten Formen enthalten, wie reitest ein und reihtest ein, aber auch Dreimeterbrett, 3-Meter-Brett und 3-m-Brett. Letztere könnte man ausschließen, wenn sie als Alternative Schreibweisen aufgeführt sind. Aber wie geht man mit Fällen wie Fliegen und fliegen oder Geliebte und geliebte um? -- Formatierer (Diskussion) 13:59, 26. Feb. 2022 (MEZ)
- Hallo Formatierer, flektierte Formen sind (für mich) Homophone, wenn sie unterschiedlich geschrieben sind. Varianten (wie die genannten Dreimeterbretter) gehören nicht rein (ggf. müssen die Alternativen Schreibweisen ergänzt werden). Fliegen (als Plural/deklinierte Form von Fliege) ist (für mich) ein Homophon, als substantivierte Form (wenn es die nur alleine gäbe) nicht (da Ableitung vom Verb). Auf Wikipedia wird gesagt: Nach Alfred Raab zählen Wörter mit gleicher Schreibweise nicht zu den Homophonen. Ich würde mich daran halten und da auch Groß-/Kleinschreibung (als "gleiche Schreibweise") einbeziehen (also auch Fliegen/fliegen ausschließen), dann machen wir garantiert erstmal nichts falsch. Viele Grüße --Jeuwre (Diskussion) 14:26, 26. Feb. 2022 (MEZ)
- Würde ich auch so sehen. Was ist mit C4/Zephyr? Peter, 14:35, 26. Feb. 2022 (MEZ)
- Homophone müssen sich wohl reimen, erleichtert das dem Bot die Arbeit? Peter, 14:36, 26. Feb. 2022 (MEZ)
- Nö. Formatierer (Diskussion) 14:44, 26. Feb. 2022 (MEZ)
- @Peter, C4/Zephyr? Duden Aussprachewörterbuch, 2015, Seite 917, transkribiert (wie wir) [ˈt͡seːˌfyːɐ̯], Krech/Stock/Hirschfeld, 2009, Seite 1067, transkribiert wie wir als zweites [ˈt͡seːˌfiːɐ̯] (was soll das Fragezeichen danach?). Eine Quelle für die bei uns genannte 3. Aussprache kenne ich nicht (warum steht diese Lautschrift dann dort überhaupt?). Also, C4/Zephyr werden unterschiedlich betont -> kein Homophon. Viele Grüße --Jeuwre (Diskussion) 16:30, 26. Feb. 2022 (MEZ)
- Das Fragezeichen ist die Vorlage:Lautschrift?. Ich habe die beiden Endbetonungen mit der Zusammenfassungszeile „Interpretiere ich die Angaben im Online-Duden richtig?“ hinzugefügt. Ich verstehe es dort so, dass auch Endbetonung möglich ist. Grüße, Peter, 17:45, 26. Feb. 2022 (MEZ)
- @Peter, C4/Zephyr? Duden Aussprachewörterbuch, 2015, Seite 917, transkribiert (wie wir) [ˈt͡seːˌfyːɐ̯], Krech/Stock/Hirschfeld, 2009, Seite 1067, transkribiert wie wir als zweites [ˈt͡seːˌfiːɐ̯] (was soll das Fragezeichen danach?). Eine Quelle für die bei uns genannte 3. Aussprache kenne ich nicht (warum steht diese Lautschrift dann dort überhaupt?). Also, C4/Zephyr werden unterschiedlich betont -> kein Homophon. Viele Grüße --Jeuwre (Diskussion) 16:30, 26. Feb. 2022 (MEZ)
- Nö. Formatierer (Diskussion) 14:44, 26. Feb. 2022 (MEZ)
- Hallo Formatierer, flektierte Formen sind (für mich) Homophone, wenn sie unterschiedlich geschrieben sind. Varianten (wie die genannten Dreimeterbretter) gehören nicht rein (ggf. müssen die Alternativen Schreibweisen ergänzt werden). Fliegen (als Plural/deklinierte Form von Fliege) ist (für mich) ein Homophon, als substantivierte Form (wenn es die nur alleine gäbe) nicht (da Ableitung vom Verb). Auf Wikipedia wird gesagt: Nach Alfred Raab zählen Wörter mit gleicher Schreibweise nicht zu den Homophonen. Ich würde mich daran halten und da auch Groß-/Kleinschreibung (als "gleiche Schreibweise") einbeziehen (also auch Fliegen/fliegen ausschließen), dann machen wir garantiert erstmal nichts falsch. Viele Grüße --Jeuwre (Diskussion) 14:26, 26. Feb. 2022 (MEZ)
- Wenn man Groß/Kleinschreibung ausfiltert, bleiben noch etwa 23400 Fälle. Wenn man noch die Bindestrichschreibweise, Getrennt-/Zusammenschreibung, ph/f, c/k, Ziffernschreibweise, etc. berücksichtigt, bleibt wahrscheinlich letztlich nur ein kleiner Rest übrig. -- Formatierer (Diskussion) 18:31, 26. Feb. 2022 (MEZ)
- Spricht eine geringe Zahl für oder gegen die Arbeit des Bots? Erstellt er Listen, die händisch durchgearbeitet werden müssen? Können wir helfen wie bei der Duden-Aktion? Peter, 07:54, 27. Feb. 2022 (MEZ)
- Ich weiß es noch nicht. Die Einträge mit gleicher Aussprache zu ermitteln war einfach. Die Groß-/Kleinschreibung zu berücksichtigen ebenfalls. Es nützt ja auch niemandem, wenn eine manuell zu prüfende Liste mit 10.000 Einträgen dabei herauskommt. Also bin ich noch dabei diese Menge zu reduzieren. Vielleicht wirst du recht behalten, dass es sehr kompliziert wird. Möglicherweise läuft es auf einige Formen unregelmäßiger Verben hinaus, die zurzeit noch nicht als Homophone gekennzeichnet sind. -- Formatierer (Diskussion) 09:18, 27. Feb. 2022 (MEZ)
- Ich denke vor allem Fälle, die durch die (norddeutsche – vgl. hier) Auslautverhärtung entstehen, wie Rad/Rat. Peter, 09:25, 27. Feb. 2022 (MEZ)
- Ich weiß es noch nicht. Die Einträge mit gleicher Aussprache zu ermitteln war einfach. Die Groß-/Kleinschreibung zu berücksichtigen ebenfalls. Es nützt ja auch niemandem, wenn eine manuell zu prüfende Liste mit 10.000 Einträgen dabei herauskommt. Also bin ich noch dabei diese Menge zu reduzieren. Vielleicht wirst du recht behalten, dass es sehr kompliziert wird. Möglicherweise läuft es auf einige Formen unregelmäßiger Verben hinaus, die zurzeit noch nicht als Homophone gekennzeichnet sind. -- Formatierer (Diskussion) 09:18, 27. Feb. 2022 (MEZ)
- Spricht eine geringe Zahl für oder gegen die Arbeit des Bots? Erstellt er Listen, die händisch durchgearbeitet werden müssen? Können wir helfen wie bei der Duden-Aktion? Peter, 07:54, 27. Feb. 2022 (MEZ)
- Also grundsätzlich machbar ist das schon, aber es sind zurzeit auf die Schnelle ausgewertet über 50.000 Fälle betroffen. Dabei sind auch alle flektierten Formen enthalten, wie reitest ein und reihtest ein, aber auch Dreimeterbrett, 3-Meter-Brett und 3-m-Brett. Letztere könnte man ausschließen, wenn sie als Alternative Schreibweisen aufgeführt sind. Aber wie geht man mit Fällen wie Fliegen und fliegen oder Geliebte und geliebte um? -- Formatierer (Diskussion) 13:59, 26. Feb. 2022 (MEZ)
- Also ich hätte nichts dagegen. Wenn es machbar ist, nur zu... ;o) Gruß --Udo T. (Diskussion) 13:15, 26. Feb. 2022 (MEZ)
Es wäre sicher eine gute Idee die Hilfeseite Hilfe:Homophone mit mehr Inhalt zu befüllen, damit der Bot ggf. auch weiß, was er zu tun hat. -- Formatierer (Diskussion) 10:49, 27. Feb. 2022 (MEZ)
- Ich denke, die aktuelle Definition im Schwesterprojekt „ein Wort, das die gleiche Aussprache wie ein anderes mit unterschiedlicher Bedeutung hat“ trifft es genau. Ob Homographen dazugehören, ist für das Wiktionary irrelevant, weil diese im gleichen Eintrag mit einem gemeinsamen Ähnlichkeiten-Baustein angeführt sind. Eine offene Frage sind noch Substantivierungen (vor allem von Verben und Adjektiven), ich würde sie nicht mitaufnehmen, sie stehen ja auch schon bei „siehe auch“. Peter, 18:12, 27. Feb. 2022 (MEZ)
- Bei den Substantivierungen kommt es wohl darauf an, wie weit oder eng man den Begriff der Bedeutung fasst. Aber sie bringen ja keinen echten Mehrwert und könnten per Definition explizit ausgeschlossen werden. Formatierer (Diskussion) 18:29, 27. Feb. 2022 (MEZ)
- So, ich habe nun eine Liste zusammengestellt, die Groß-/Kleinschreibung, Schreibung mit Apostroph (Fritz/Fritz’), Bindestrich-Schreibung und Schreibung mit Leerzeichen ausschließt. Dabei sind etwa 500 Einträge zusammengekommen, von denen etwa 180 tatsächliche Homophon-Kandidaten waren. Der Einfachheit halber habe ich diese gleich manuell eingetragen, da eine Aufbereitung der Liste und Anpassung des Bots sich nicht gelohnt hätte. Erledigt. -- Formatierer (Diskussion) 07:11, 23. Jul. 2022 (MESZ)
- Bei den Substantivierungen kommt es wohl darauf an, wie weit oder eng man den Begriff der Bedeutung fasst. Aber sie bringen ja keinen echten Mehrwert und könnten per Definition explizit ausgeschlossen werden. Formatierer (Diskussion) 18:29, 27. Feb. 2022 (MEZ)
unzulässige Umleitungen
[Bearbeiten]Vielen Dank für Deine unermüdliche Arbeit! Der Eintrag itinerario ist ohne Deine Schuld derzeit in einem m. E. unschönen Zustand. Übersetzungen sollten nämlich laut Meinungsbild nur bei Eigennamen umgeleitet werden. Der gleiche Effekt könnte allerdings auch bei Toponymen auftreten, wo die Umleitung gerechtfertigt ist. Und hier wird es schlimm: spago – und noch interessanter bei tesoro. Gruß, Peter, 16:43, 11. Dez. 2022 (MEZ)
Hier wurde zwar links auf Liste geändert, die Übersetzungen aber nicht getrennt. Liegt es an der Unterteilung oder an der gleichlautenden Zuordnung, wäre es noch erfolgt oder hat es einen anderen Grund? Gruß auch an Deinen Meister, Peter, 09:21, 18. Dez. 2022 (MEZ)
- Es liegt an der Unterteilung der Bedeutung in 2a und 2b. Diese bearbeitet der Bot nicht. -- Formatierer (Diskussion) 10:07, 18. Dez. 2022 (MEZ)
nur eine Glosse
[Bearbeiten]Wieso hast Du bei der Konrektorin eine Glosse formuliert, die andere aber nicht? Hat es etwas mit der Länge der Bedeutungsformulierung zu tun? Gruß auch an Deinen Meister, Peter, 09:45, 22. Dez. 2022 (MEZ)
- Mir wurde eine willkürliche Grenze von 64 Zeichen gesetzt. Auch darf ich die Glosse nicht übernehmen, wenn bestimmte Zeichen vorhanden sind. --Instance of Bot (Diskussion) 13:40, 22. Dez. 2022 (MEZ)
1]
[Bearbeiten]Kümmert sich Dein Meister um die weiteren Einträge in dieser Liste: insource:/\}\: 1\]/
? Oder kann ich sie abarbeiten oder gilt, wer zuerst dran ist, macht? Bearbeitungskonflikte zu vermeiden versuchende Grüße, Peter, 17:17, 23. Dez. 2022 (MEZ)
- Kannst du machen wie du magst. -- Formatierer (Diskussion) 17:45, 23. Dez. 2022 (MEZ)
- So machen wir's. Ich schau in den nächsten Tagen gelegentlich, was noch da ist, und kümmere mich gegebenenfalls darum. Oft kann man ja dann noch ein bisschen etwas formal verbessern. Gruß und Dank für Deine Antwort, Peter, 17:52, 23. Dez. 2022 (MEZ)
nicht aufgeteilte Übersetzungsabschnitte
[Bearbeiten]… sind mir zuerst beim Tier aufgefallen. Mit insource:/\}\: \[1\] \{\{Ü/
habe ich noch mutmaßlich etwas 10 000 gefunden, zum Beispiel übertragen. Ich weiß aber nicht, was sie gemeinsam haben. Gruß auch an Deinen Meister, Peter, 17:34, 3. Jan. 2023 (MEZ)
- Es gibt etwa ein Dutzend Gründe, die als Ursache in Frage kommen. -- Formatierer (Diskussion) 08:43, 4. Jan. 2023 (MEZ)
- Kann
*{{fr}}: []
(ohne Zahl in der Klammer) ein Grund sein? Dieser ließe sich m. E. leicht automatisiert beseitigen. Gruß dem Meister und Gehilfen, Peter, 10:16, 25. Feb. 2023 (MEZ)- Da gibt es viele verschiedene Ursachen, die meisten sind aber von der Art, dass eine entsprechende Bedeutung nicht existiert oder die Form abweichend ist, wie: [4a], [1. 2], [*], [?] oder [1/2, 3], [ 4] usw. Natürlich könnte man jetzt für jeden dieser Fälle das Programm anpassen. Das lohnt sich aber nicht wirklich, wenn man dann sieben oder acht Fälle pro Änderung zusätzlich abarbeiten kann. -- Formatierer (Diskussion) 11:02, 25. Feb. 2023 (MEZ)
- Klar. Aber die französische Nichtbedeutung ist mir in der letzten Zeit mehrfach untergekommen und die Suche mit
insource:/\*\{\{fr\}\}\: \[\]/
liefert fast 1900 Treffer, das wären dann etwa 28,7 % der noch Umzustellenden. Peter, 11:14, 25. Feb. 2023 (MEZ)- Erledigt. Formatierer (Diskussion) 17:36, 25. Feb. 2023 (MEZ)
- Klar. Aber die französische Nichtbedeutung ist mir in der letzten Zeit mehrfach untergekommen und die Suche mit
- Da gibt es viele verschiedene Ursachen, die meisten sind aber von der Art, dass eine entsprechende Bedeutung nicht existiert oder die Form abweichend ist, wie: [4a], [1. 2], [*], [?] oder [1/2, 3], [ 4] usw. Natürlich könnte man jetzt für jeden dieser Fälle das Programm anpassen. Das lohnt sich aber nicht wirklich, wenn man dann sieben oder acht Fälle pro Änderung zusätzlich abarbeiten kann. -- Formatierer (Diskussion) 11:02, 25. Feb. 2023 (MEZ)
- Kann
Systematischer Fehler?
[Bearbeiten]Hier ist bei der koreanischen Übersetzung etwas passiert ([[Südkorea|Süd]
), was die gesamte Übersetzungstabelle zerstört hat. Ein nicht angemeldeter Benutzer hat es dann repariert. Ich denke nicht, dass es ein systematischer Fehler ist, der noch öfter auftritt, möchte es aber dennoch melden. Gruß, auch an Deinen Meister, Peter, 17:49, 17. Apr. 2023 (MESZ)
- Das ist schon einmal bei Magazin aufgetreten, aber da ich das im Dump jeweils sofort finde, habe ich nichts zur Reparatur unternommen. -- Formatierer (Diskussion) 18:40, 17. Apr. 2023 (MESZ)
Wunschliste
[Bearbeiten]Hallo Formatierer, dein Bot hat beim Entfernen der Einträge aus der Wunschliste einige Einträge gelöscht, die bereits angelegt wurden, jedoch nicht als Grundformen (Lemmata) - Lethe, Noppen, Stammesangehörige, Wirtschaftsweiser, Jasse. Beim letzten Mal habe ich versucht, dies rückgängig zu machen, aber anscheinend besteht das Problem weiterhin. LG, Random Coffee (Diskussion) 22:05, 19. Mär. 2024 (MEZ)
- Danke für die Meldung. Um die blauen Links zu ermitteln, liest der Bot die HTML-Version der Seite. Da ist irgendetwas an der Mediawiki-Software geändert worden. Statt
<h2>
bei Überschriften steht da nun<h2 data...>
. Dadurch hat der Bot die Orientierung verloren und wusste nicht mehr welche Prüfungen er durchführen soll. Ich frage nun einfach auf</h2>
ab, und es funktioniert wieder. -- Formatierer (Diskussion) 17:40, 21. Mär. 2024 (MEZ)