Wiktionary:Fragen zum Wiktionary

Aus Wiktionary, dem freien Wörterbuch
(Weitergeleitet von Hilfe:Ich brauche Hilfe)
Zur Navigation springen Zur Suche springen

Abkürzung: WT:FZW

……………▼ Ende der Seite ▼……………
Willkommen

Du hast Fragen zum Wiktionary? Dann bist du hier richtig! Beachte aber, dass viele Fragen bereits hier beantwortet werden.
Was nicht hierher gehört, sondern wofür es eigene Seiten gibt:

  • Wiktionary:Auskunft für linguistische Fragen
  • Wiktionary:Vandalismusmeldung zum Melden von Vandalismus, Edit-Wars und persönlichen Angriffen
  • Wiktionary:Verschiebewünsche für Anfragen zum Verschieben von Artikeln
  • Wiktionary:Hilfe, um das Wiktionary zu lesen und zu bearbeiten

Abschnitte, in denen länger als drei Monate nichts geschrieben wurde, oder drei Tage lang mit dem Erledigt-Baustein markiert sind, werden hier automatisch archiviert. Setze, gemäß den Hinweisen auf der jeweiligen Archiv-Seite, einen Link auf den Abschnitt der archivierten Diskussion, und weise hier daraufhin, wenn du eine Diskussion wieder aufnehmen willst. Schreibe NIEMALS im Archiv.

Meerkatmascotfull bg F7F8FF.png

Hier stellst du deine Frage
Unterschreibe bitte mit
-- ~~~~
Hilfe
Diskussion
Auskunft und Archiv durchsuchen
pix.gif
pix.gif
pix.gif
pix.gif
pix.gif

Liste aller Einträge, bei denen es in der letzten Woche irgendwelche Änderungen gab[Bearbeiten]

Ich habe eine technische Frage zu Dumps von Wiktionary und bin mir gar nicht sicher, ob das hier der richtige Ort ist um sie zu stellen. Wenn nicht, entschuldige ich mich und bitte um kurzes sachdienliches Feedback.

Hier ist meine Frage: Ich suche eine Liste aller Einträge, bei denen es in der letzten Woche irgendwelche Änderungen gab. Gibt es so etwas? Unter welcher URL ist diese Liste abrufbar?

Hintergrund: Ein von mir geschriebenes Script schaut jeden Tag auf der Seite https://dumps.wikimedia.org/dewiktionary/latest/ nach, wann die aktuelle Version der Datei dewiktionary-latest-all-titles-in-ns0.gz erstellt wurde. Wenn es eine neue Version gibt, lädt das Skript sie herunter. In dieser Datei stehen alle Lemmata von de.wiktionary.org (nur die Lemmata, keine Inhalte). Das Skript vergleiche diese Liste mit den Einträgen, die bereits in meiner Datenbank stehen, markiert Einträge als gelöscht, wenn sie in der aktuellen Liste nicht mehr vorkommen, und merkt Einträge zum Downloaden vor, die noch nicht in meiner Datenbank existieren. Ein anders Skript geht dann alle neuen Einträge durch und lädt dann der Reihe nach deren Inhalte herunter, indem es z.B. diese Seite aufruft: https://de.wiktionary.org/w/index.php?action=raw&title=Haus wobei natürlich anstelle von Haus das jeweilige Lemma verwendet wird. Um sowohl die Bandbreite meines eigenen Servers als auch die des Wiktionary-Servers zu schonen, macht dieses Skript zwischen zwei Lemmata immer eine kurze Pause und lädt dadurch pro Tag die Inhalte von maximal ca. 100.000 Lemmata herunter. Es gibt insgesamt ca. 1.000.000 Lemmata, daher ist der Download des gesamten deutschen Wiktionarys in weniger als 2 Wochen erledigt gewesen.

Und jetzt kommt's: Ich möchte meine Datenbank möglichst aktuell halten, möchte aber auch möglichst wenig Daten herunterladen. Vor allem will ich keine Inhalte herunterladen, die ich in genau deselben Version schon habe. Ich möchte also idealerweise nur die Inhalte jener Lemmata herunterladen, bei denen es seit dem letzten Dump irgendeine Veränderung gab. Gibt es eine solche Liste? Wenn ja: Wo kann ich sie finden? (vorstehender nicht signierter Diskussions-Beitrag stammt von Hubert1965DiskussionBeiträge ° --15:07, 7. Jul. 2021‎ (MESZ))[Antworten]

Artikel zum Wort "Mitarbeitende", gehört sowas ins Wiktionary?[Bearbeiten]

Hallo zusammen, ich hab mal ne kurze Frage zum Wiktionary: Gehört ein Wort wie "Mitarbeitende", also das substantivierte Adjektiv von "mitarbeitende/r"(?! :), ins Wiktionary? Da ich bisher noch nie hier was bearbeitet/erstellt habe, wollt ich mal kurz nachfragen bevor ich mir da umsonst die Arbeit mache. Besonders im Kontext der geschlechtsneutralen Umschreibungen kommt dieses Wort ja inzwischen eher öfters vor. --Bthfan (Diskussion) 17:43, 30. Jul. 2021 (MESZ)[Antworten]

Wenn du es im Eintrag ordentlich belegen kannst, kein Problem. Siehe hierzu Hilfe:Referenzen und Hilfe:Belegen, sowie bei diesem Lemma möglicherweise dann auch Wiktionary:Fünf-Zitate-Regel. Es kommt halt (noch) nicht in einer gängigen Standard-Referenz wie z. B. duden.de oder dwds.de vor. Gruß --Udo T. (Diskussion) 17:49, 30. Jul. 2021 (MESZ)[Antworten]
Nachtrag: Bitte dann auch Hilfe:Adjektivische Deklination beachten. Außerdem: „Mitarbeitende“ wäre dann das Lemma mit weiblichem Genus und „Mitarbeitender“ das Lemma mit männlichem Genus. --Udo T. (Diskussion) 17:55, 30. Jul. 2021 (MESZ)[Antworten]
hier sind bereits angelegte Substantive zur adjektivischen Deklination, als Inspiration und Vorbild, Filmende hat zb als eine von 3 Bedeutungen die weibliche Form zu Filmender, mlg Susann Schweden (Diskussion) 19:06, 30. Jul. 2021 (MESZ)[Antworten]
Mitarbeitender und Mitarbeitende sind im Singular beide nicht geschlechtsneutral. Meines Erachtens sind diese Bildungen derzeit im Kommen, weil sie im Plural gleichlautend und daher geschlechtsneutral sind. Peter, 20:06, 30. Jul. 2021 (MESZ)[Antworten]

Ausblenden von flektierten Formen in der rückläufigen Wörterliste[Bearbeiten]

In unserer rückläufigen Wörterliste sind auch flektierte Formen verzeichnet. Existiert eine Funktion bzw. gibt es einen Trick, um nur Lemmaeinträge anzeigen zu lassen? Ich frage nach, weil eine solche Funktion für eine automatische Generierung von Flexionstabellen nützlich wäre. --Latisc (Diskussion) 21:08, 5. Aug. 2021 (MESZ)[Antworten]

Kannst du das etwas näher erläutern, wie das automatische Generieren dadurch funktionieren soll. Und warum müssen die Lemmata dazu rückwärts sortiert sein? -- Formatierer (Diskussion) 06:47, 6. Aug. 2021 (MESZ)[Antworten]
Geht es darum, dass in vielen Sprachen gleich endende Nennformen oft gleich flektiert werden? Peter, 08:13, 6. Aug. 2021 (MESZ)[Antworten]
Das kann sein. Ich habe nur deshalb noch einmal nachgefragt, um sicherzustellen, dass es sich bei der Frage nicht um ein w:XY-Problem handelt. So dass eine Lösung zur Frage vielleicht gar nicht direkt zum Ziel führt, sondern dass das Ziel auch auf einem anderen womöglich besser geeigneten Weg erreicht werden kann. -- Formatierer (Diskussion) 10:32, 6. Aug. 2021 (MESZ)[Antworten]
Danke, jetzt weiß ich wenigstens, wie das heißt, was ich oft beobachte. Peter, 11:08, 6. Aug. 2021 (MESZ)[Antworten]
@Latisc: Es existiert eine versteckte Wartungskategorie Kategorie:Wartung fehlende Flexion Verb (Deutsch), mit der festgestellt werden kann, für welches deutsche Verb noch eine Flexion fehlt. Da aber eine angelegte Flexion Voraussetung für die halbautomatische Generierung von flektierten Formen darstellt, enthält diese Kategorie meist keinen Eintrag. Gruß, Alexander Gamauf (Diskussion) 14:41, 6. Aug. 2021 (MESZ)[Antworten]
Die Grundidee ist, dass Wörter mit gleicher Endung meist analog flektiert werden, z. B. ApfelbäumeTriebwerksräume oder NeuigkeitenEinfältigkeiten. Es gilt also nachzusehen, welches bereits vorhandene Lemma dieselbe Endung aufweist, um die Flexionsformen eines noch nicht existierenden Begriffs (hier als Beispiel Triebwerksraum und Einfältigkeit) auf diese Weise zu generieren. --Latisc (Diskussion) 16:18, 6. Aug. 2021 (MESZ)[Antworten]
Es gibt zwar das Tool PetScan mit dem man die Schnittmenge zweier Kategorien ermitteln kann und es hat auch zahlreiche Optionen zur Sortierung der Ergebnismenge, es fehlt allerdings die Möglichkeit den internen Sortierschlüssel einer Kategorie, auf den es hier ja ankommt, als Sortierkriterium auszuwählen. Ich habe also eine neue Kategorie Kategorie:Rückläufige Wörterliste Grundformeintrag (Deutsch) erstellt, die das Gewünschte leistet. -- Formatierer (Diskussion) 14:22, 9. Aug. 2021 (MESZ)[Antworten]
@Formatierer Perfekt, vielen Dank dafür! --Latisc (Diskussion) 22:24, 9. Aug. 2021 (MESZ)[Antworten]
Hallo Latisc, die Kategorie ist aber noch nicht komplett gefüllt; das kann u. U. noch eine Weile dauern. Gruß --Udo T. (Diskussion) 22:28, 9. Aug. 2021 (MESZ)[Antworten]

Anzahl der genannten Einträge in Verzeichnissen[Bearbeiten]

Kann mir jemand sagen, wie viele Einträge auf Seiten wie z. B. Verzeichnis:Deutsch/Essen und Trinken/Speisen möglich/sinnvoll sind? --Seidenkäfer (Diskussion) 14:48, 9. Aug. 2021 (MESZ)[Antworten]

Möglich sind aus Wikipedia:Article_size: The maximum limit for Wikipedia is set by the MediaWiki software default article size limit, 2048 kibibytes (specifically, 2,097,152 bytes). Pro Zeile benötigt man *[[]] + Zeilenumbruch = 6 Bytes + Länge des Wortes (Umlaute benötigen 2 Bytes) Bei einer durchschnittlichen Wortlänge von 10 Zeichen ist also bei etwa bei 130.000 Einträgen das Limit erreicht. Sinnvoll ist sicherlich weniger. -- Formatierer (Diskussion) 16:50, 9. Aug. 2021 (MESZ)[Antworten]
Danke für die Antwort, dann wären wir also auch nach Zusammenführung von Speisen, Lebensmitteln, Obst und Gemüse wohl vorerst noch im akzeptablen Bereich. (Sehr viele Stichwörter sind drei- oder zweimal genannt, z. B. Apfel in Speisen, in Lebensmittel und in Obst und Gemüse.) Siehe auch [1] --Seidenkäfer (Diskussion) 17:59, 9. Aug. 2021 (MESZ)[Antworten]