Kategorie Diskussion:Rückläufige Wörterliste (Deutsch)

Seiteninhalte werden in anderen Sprachen nicht unterstützt.
Aus Wiktionary, dem freien Wörterbuch

Hinweis auf Wortsuche nach Endung[Bearbeiten]

Ausmaß[Bearbeiten]

@Formatierer: Irgendwie habe ich den Eindruck, dass dieses Wort umseitig nicht angezeigt wird. Ratlose Grüße, Peter, 12:51, 25. Nov. 2022 (MEZ)[Beantworten]

Hm, alles, was auf „-ß“ endet, erscheint offensichtlich nicht in den rückläufigen Wörterlisten. Gruß --Udo T. (Diskussion) 12:59, 25. Nov. 2022 (MEZ)[Beantworten]
Doch etwas ominöser: Sucht man nach „äß“ erscheint zwar an erster Stelle das „Bronzegefäß“ aber nicht das „Gefäß“ oder evtl. weitere „-gefäße“... Gruß --Udo T. (Diskussion) 13:01, 25. Nov. 2022 (MEZ)[Beantworten]
Ja, das mir auch bereits aufgefallen, dass an manchen Stellen im Wiktionary die Einsortierung des 'ß' Probleme bereitet. Wahrscheinlich ist eine w:Locale-Einstellung nicht konsistent über alle vorhandenen Softwarekomponenten hinweg konfiguriert oder auch gar nicht möglich. -- Formatierer (Diskussion) 13:51, 25. Nov. 2022 (MEZ)[Beantworten]
Die Unsichtbarkeit scheint nur ältere Einträge zu betreffen. Die "neueren", ab einem bestimmten Datum, das ich noch nicht kenne, werden alphabetisch so einsortiert, als ob sie mit "ss" statt mit "ß" geschrieben würden. Wenn man sich in der Kategorie:Deklinierte Form (Deutsch) die Einträge ab "Bussards" anzeigen lässt, fehlt "Bußen", aber "bußfertige" folgt auf "Bussen". Entweder wurde die Erstellung des Sortierschlüssels geändert, oder die Bearbeitung entsprechender Abfrageergebnisse. Das Verhalten ähnelt dem der Reimkategorien, nachdem dort - ich glaube mit PHP7 - für einige Zeichen Groß- und Kleinschreibung eingeführt wurde. -- Formatierer (Diskussion) 17:41, 25. Nov. 2022 (MEZ)[Beantworten]
So, das Dunkel lichtet sich und langsam zeigt sich das Ausmaß des Problems. Ich habe mal mit dem Datenbanktool QUARRY einige Nachforschungen angestellt. In der internen Datenbanktabelle categorylinks konnte ich zumindest den Zeitpunkt des Auftretens des Problems näher eingrenzen. Dazu muss man wissen, dass der Sortierschlüssel aller Kategorien bei uns berechnet wird, indem der Eintrag in Großbuchstaben gewandelt wird. Da es "früher" kein großes Eszett gab, wurde dieses als Kleinbuchstabe im Sortierschlüssel gelassen. Der letzte Eintrag, dessen Schlüssel so erstellt wurde, war "Straßenpflege" am 22.9.2022. Danach wurde der Schlüssel so erstellt, dass das 'ß' in 'SS' gewandelt wird. Dies betrifft als erstes den Eintrag "ließ zusammen" vom 29.9.2022. Zwischen diesen beiden Zeitpunkten muss die Software entsprechend geändert worden sein. Nun haben wir ein Mischmasch aus alten und neuen Sortierschlüsseln, sodass man nichts mehr wiederfindet.
categorylinks:
cl_from cl_to cl_sortkey cl_timestamp cl_sortkey_prefix cl_collation cl_type
1294232 Rückläufige_Wörterliste_(Deutsch) EGELFPNEßARTS STRAßENPFLEGE 2022-09-22T15:55:53 egelfpneßartS uppercase page
1295614 Rückläufige_Wörterliste_(Deutsch) NEMMASUZ SSEIL LIESS ZUSAMMEN 2022-09-29T17:59:41 nemmasuz ßeil uppercase page
- Formatierer (Diskussion) 18:01, 26. Nov. 2022 (MEZ)[Beantworten]
Hallo Formatierer, ich habe auch mal nachgeschaut und was ich noch nicht ganz verstehe: Warum werden „Straßenpflege“, „ließ zusammen“ und „Bronzegefäß“ (angelegt am 30.09.22) in Kategorie:Rückläufige Wörterliste (Deutsch) jeweils angezeigt, wenngleich nicht immer an 1. Stelle (Straßenpflege)? Aber „Ausmaß“ wird überhaupt nicht angezeigt. Und „Bronzegefäß“ wird in Kategorie:Rückläufige Wörterliste (Deutsch) sogar korrekt unter „ß“ angezeigt, obwohl der Sortierschlüssel ja bereits „-SS“ am Ende ist.
122440, Rückläufige_Wörterliste_(Deutsch), "ßAMSUA AUSMAß", 2013-11-14 14:35:57, ßamsuA, uppercase, page
1294232, Rückläufige_Wörterliste_(Deutsch), "EGELFPNEßARTS STRAßENPFLEGE", 2022-09-22 15:55:53, egelfpneßartS, uppercase, page
1295614, Rückläufige_Wörterliste_(Deutsch), "NEMMASUZ SSEIL LIESS ZUSAMMEN", 2022-09-29 17:59:41, nemmasuz ßeil, uppercase,page
1296105, Rückläufige_Wörterliste_(Deutsch), "SSÄFEGEZNORB BRONZEGEFÄSS", 2022-09-30 15:39:15, ßäfegeznorB, uppercase,page
Wäre es denkbar, dass wenn wir alle Einträge mit einem „-ß-“ oder „-ß“ aus den beiden "rückläufigen" Kategorie entfernen und dann wieder hinzufügen könten, danach dann alles wieder korrekt wäre? Und falls das ginge, könnte das ein Bot (vorzugsweise Deiner) dann machen? Es gibt aktuell 24.123 Einträge mit einem einem „-ß-“ oder „-ß“. Von daher wäre es doch eigentlich eine überschaubare Aktion (wenn es denn ginge). Eine Liste der Einträge mit einem einem „-ß-“ oder „-ß“ könnte ich Dir bei Bedarf zur Verfügung stellen (oder Du ziehst sie Dir selber über Quarry ab).
Gruß --Udo T. (Diskussion) 19:14, 26. Nov. 2022 (MEZ)[Beantworten]
P.S.: Falls es nur die Einträge mit einem „-ß“ am Ende betreffen sollte: Das wären sogar nur 1.825 Einträge... Gruß --Udo T. (Diskussion) 19:18, 26. Nov. 2022 (MEZ)[Beantworten]
P.P.S.: Ich habe gerade mal testhalber den Eintrag „Ausmaß“ gelöscht und danach sofort wiederhergestellt. Nun erscheint er (wieder) in Kategorie:Rückläufige Wörterliste (Deutsch) und in der Tabelle categrylinks steht nun:
122440, Rückläufige_Wörterliste_(Deutsch), "SSAMSUA AUSMASS", 2022-11-26 18:20:34, ßamsuA, uppercase, page
Gruß --Udo T. (Diskussion) 19:25, 26. Nov. 2022 (MEZ)[Beantworten]
Ich will erst noch weitere Seiteneffekte erforschen. Es muss ja nicht so sein, dass mit 'SS' alles problemlos funktioniert. Es könnte sein, dass uns die beiden 'S' andere weitere Probleme bereiten. Man kann aber auch eine Konfigurationsänderung beantragen, dass nicht uppercase, sondern eine andere Methode für die Schlüsselerstellung verwendet wird, dann werden über ein Maintenance-Skript automatisch die Schlüssel aller Kategorien neu erstellt. Das habe ich gerade in meiner Entwicklerversion getestet und funktioniert dort. Ich habe allerdings nicht die allerneueste Mediawikiversion. Außerdem sollte man klären, ob die Schlüsselerzeugung jetzt immer so gewollt ist und nicht ein Fehler, der bald wieder korrigiert wird. -- Formatierer (Diskussion) 19:44, 26. Nov. 2022 (MEZ)[Beantworten]
Zunächst einmal: Die Einträge mit 'ß' sind nicht aus den jeweiligen Kategorien verschwunden, sondern erscheinen wegen der geänderten Sortierreihenfolge nur an anderer Stelle. Weil ich beim Eintrag ß die Sortierreihenfolge überschrieben habe, erscheint dieser Eintrag nun in der Kategorie:Buchstabe_(Deutsch) direkt nach dem 'S'. Mein Tool, das es ermöglicht, die Kategorieanzeige ab einem bestimmten Eintrag zu starten ("Liste starten bei Einträgen, die beginnen mit:"), funktioniert nicht richtig, da es mit den zwei Versionen der Sortierschlüssel nicht arbeiten kann. Andererseits funktioniert auch die Wikipediasoftware bei der Kategorieanzeige nicht richtig. Denn das 'ß', das auch in der Kategorie Substantiv (Deutsch) enthalten ist, sollte eigentlich nach "Sri-Lankerin" und vor "SS-Brigadeführer" auftauchen, wird aber am Ende der Seite aufgelistet. Ich denke, das ist ein Seiteneffekt, der damit zu tun hat, dass das erste Zeichen eines Eintrags immer als Überschrift verwendet wird, und dann von der Wikisoftware unter 'ß' erst am Ende der Seite eingruppiert wird. Das passiert immer, wenn das 'ß' der erste oder einzige Buchstabe eines Wortes ist. Normalerweise fällt es einem nicht auf, da kein Wort außer dem Buchstaben selbst mit einem 'ß' beginnt. Eine Ausnahme ist da unsere rückläufige Wörterliste. -- Formatierer (Diskussion) 14:21, 27. Nov. 2022 (MEZ)[Beantworten]
Mit diesem Wissen gelingt es nun auch das "Ausmaß", das ja inzwischen einen SS-Sortierschlüssel (man möge mir den Begriff verzeihen) hat, wiederzufinden. Man überlistet das "Starten ab"-Eingabefeld indem man "Ausmass" eingibt und schon werden die neuerfassten Begriffe angezeigt. Die alten mit 'ß' am Ende findet man, indem man im Inhaltsverzeichnis auf das A-Macron (Ā) klickt und von dort aus rückwärts blättert. Das kann so natürlich nicht bleiben. Deshalb werde ich einen Bug-Report erstellen. -- Formatierer (Diskussion) 15:23, 27. Nov. 2022 (MEZ)[Beantworten]
phab:T323868 -- Formatierer (Diskussion) 17:18, 27. Nov. 2022 (MEZ)[Beantworten]
Was mir gerade noch so auffällt: In der Kategorie:Buchstabe_(Deutsch) sind mal die Kleinbuchstaben vor den Großbuchstaben einsortiert und mal umgekehrt. Das liegt ebenfalls am Sortierschlüssel. Denn sind die Schlüssel erstmal in Großbuchstaben umgewandelt, sind sie für kleine und große Buchstaben gleich und die Reihenfolge ist zufällig. Vielleicht wäre eine Sortiermethode nach Unicode besser für Wiktionaries geeignet? Collation. Es gab auch mal eine Diskussion bzgl. numerischer Reihenfolge, finde sie aber nicht mehr. -- Formatierer (Diskussion) 17:37, 27. Nov. 2022 (MEZ)[Beantworten]
Hier wurde immer wieder über Sortierung gesprochen. Ob es etwas mit Deinen Überlegungen zu tun hat, weiß ich nicht. Gruß, Peter, 18:06, 27. Nov. 2022 (MEZ)[Beantworten]

Durch Ändern der Vorlage CH&LI wurden die Sortierschlüssel alle angepasst, das heißt, es gibt keine alten Schlüssel mehr, die noch das kleine 'ß' enthalten. Somit ergibt sich beispielweise für die Kategorie Substantiv (Deutsch), dass Muse, Muße und Mußestunde so einsortiert sind, als würden Muße und Mußestunde wie Musse und Mussestunde geschrieben. Ein kleines Problem bleibt jedoch in unseren rückläufigen Wörterlisten bestehen, wenn Wörter auf 'ß' enden. Die Wortreihenfolge in der Kategorie ist zwar korrekt, aber da auf den dargestellten Seiten die Wörter nach ihrem Anfangsbuchstaben, der hier jedoch der Endbuchstabe ist, gruppiert werden, werden Spaß und Spass nicht hintereinander angezeigt, sondern Spaß unter der Überschrift 'ß' und Spass unter der Überschrift 'S', siehe: Spaß. Ich denke damit kann und muss man Leben, da wir hier einen Spezialfall haben, der nur durch unsere Sortkey-Umbiegerei entsteht. Für mich ist das Thema damit erledigt. -- Formatierer (Diskussion) 08:28, 24. Feb. 2024 (MEZ)[Beantworten]