Benutzer Diskussion:Mapmarks/Archiv/2015/Jul

aus Wikisource, der freien Quellensammlung
Zur Navigation springen Zur Suche springen
Archiv Diese Seite ist ein Archiv abgeschlossener Diskussionen. Ihr Inhalt sollte daher nicht mehr verändert werden. Benutze bitte die aktuelle Diskussionsseite.

Um einen Abschnitt dieser Seite zu verlinken, klicke im Inhaltsverzeichnis auf den Abschnitt und kopiere dann Seitenname und Abschnittsüberschrift aus der URL-Zeile deines Browsers (Beispiel: [[Benutzer Diskussion:Mapmarks/Archiv/2015/Jul#Abschnittsüberschrift]]).

Vorlage:Listendaten und GND

Bester Mapmarks,
hast Du nicht Lust die Vorlage:Listendaten mit einem GND-Feld auszustatten, analog zu Vorlage:Zeitschrift? Diese Daten scheinen doch immer wichtiger zu werden und viele Listen lassen sich ja zielgenau verknüpfen. Viele Grüße von --Konrad Stein (Diskussion) 12:16, 9. Jul. 2015 (CEST)

Mach ich gern, wenn mir nicht unser Vorlagenbaumeister THE IT zuvorkommen sollte … --Mapmarks (Diskussion) 19:01, 9. Jul. 2015 (CEST)
:-D ... ich kann mich zurückhalten. --THE IT (Diskussion) 21:55, 9. Jul. 2015 (CEST)
PS:Ich fühle mich geehrt.
Hab’s eingebaut. Etwas übersehen? dann bitte mitteilen. Gute Nacht --Mapmarks (Diskussion) 22:11, 9. Jul. 2015 (CEST)

Die Vorlage:Textdaten könnte noch die Beacon-Erweiterung ("Weitere Angebote") bekommen. Ob die Vorlage:Verlag zukünftig intensiver genutz werden wird? Bei den „Körperschaften“ habe ich jetzt nicht nachgesehen, dürfte aber alles Liste sein. Und bei „Rechtstexte“ kenn ich mich einfach nicht aus. Danke jedenfalls, viele Grüße --Konrad Stein (Diskussion) 22:29, 9. Jul. 2015 (CEST)

Gibt es denn so viele Texte mit genau zuordenbarer GND? – ich denke da an die laufende Diskussion im WS:SKR zu Wikidata und Winterreise. Verlag-Seiten finde ich eine schöne und interessante Ergänzung und sähe gern, es würde diese weiter ausgebaut werden. Schönen Gruß --Mapmarks (Diskussion) 22:08, 10. Jul. 2015 (CEST)

Ich habe den Eindruck, dass der Bereich Werk-GND gerade am stärksten wächst. Bei der Winterreise ist das Problem, dass wir mehrere Fassungen haben – das Werk ist dasselbe. Den Fall haben wir aber nicht sehr oft.
@Verlage: als ich mal das Buch „S. Fischer und sein Verlag“ gelesen habe, dachte ich, das sei ein erstklassiges WS-Projekt: eine chronologische Auflistung des Verlagsprogramms samt Links zu den Erstausgaben = erfahrbare Literaturgeschichte. Bis in die 1930er Jahre würde man ziemlich weit kommen (ich hatte mal Stichproben gemacht). Wäre ein aufwändiges, aber ziemlich schönes Projekt. Grüße von --Konrad Stein (Diskussion) 10:02, 11. Jul. 2015 (CEST)

Nacharbeiten GL 1877

Hallo Mapmarks, danke für die Nacharbeiten. Das mit dem richtigen Bindestrich habe ich schon geändert in meinem JS. Gibt es da auch etwas automatisches für die Sortierung oder ist das alles Handarbeit? --Arnd 18:29, 19. Jul. 2015 (CEST)

Hallo Arnd, mach ich gerne. Ist noch Handarbeit, THE IT will sich etwas Automatisches ausdenken. Das Sortieren betrifft auch nicht nur die Gartenlaube. Um die manuell zu sortierenden Artikel zu finden, benutze die Liste der neuen Artikel und sehe vor allem nach Umlauten. Habe eine Hilfe-Seite in Vorbereitung mit Beispielen der häufigsten Fälle, angelehnt an WP, siehe Benutzer:Mapmarks/Sortieren --Mapmarks (Diskussion) 18:38, 19. Jul. 2015 (CEST)

Sortieren again

Hallo Mapmarks,

ich habe heute mal ein wenig gespielt. ... Das Ergebnis wird in ca. drei Stunden eine Liste mit allen Seiten sein die keinen SortKey haben. und in deren Titel einer der folgenden Buchstaben vorkommt.

ÁáĆćÉéÍíŃńÓóŚśÚúÝýŹźǾǿÀàÈèÌìÒòÙùÂâĈĉÊêĜĝĤĥÎîĴĵÔôŝŜÛûÄäËëÏïÖöÜüÿÃã ÑñÕõÅåÇ窺ǍǎČčĎďĚěǦǧǏǐĽľŇňǑǒŘřŠšŤťǓǔŽžŁłŐőŰűØøĀāĒēĪīŌōŪūȲȳĂăĔĕĞğĬĭŎŏŬŭ ßÆ挜ÐðÞþ

Bisher ist diese Liste 5000 Einträge lang. Das wird es dir wohl eher erschweren alle von Hand durchzugehen. Was hälst du davon, dass ich doch eine automatische Ersetzung durchführe. Nach dem Motto áàâäãåǎāă --> a. Dann wäre zumindest alle Sondersymbole abgedeckt. Ich könnte den Tag einfach immer ans Ende der Seite stellen. Danach steht es dir frei weitere Suchmuster zu überlegen, die du dann von Hand abklopfen kannst. Dabei musst du dich auch nicht zurück halten. Regular Expressions sind verdammt mächtig.

--THE IT (Diskussion) 19:39, 20. Jul. 2015 (CEST)

Recht lieben Dank, das hört sich sehr gut an und ich bin gespannt auf die Liste, scheint ziemlich viel zu sein.
Zu den Zeichen noch die Anmerkung, dass die Ersetzung auf den Grundbuchstaben auf alle obigen zutrifft, bis auf das Eszett (=„ss“) und die Ligaturen (=„ae“,„oe“). Die Buchstaben Ð,ð und Þ,þ müssen nach meinem Wissen als „th“ behandelt werden.
Weitere Suchmuster, die ich manuell verfolgt habe, sind vor allem:
  • Anführungszeichen, Satzzeichen wie Komma, Punkt, Ausrufe- und Fragezeichen (alle entfernen)
  • bestimmte und unbestimmte Artikel wie der, die, das, ein, eine, eines (ans Ende stellen)
  • Klammerzusätze im Titel (auflösen)
Hier ein erfundenes Beispiel (mit schrittweiser Änderung, sonst in einem Schritt auszuführen):
Der „süße“ Brei (Meyer)
Der süße Brei (Meyer)     // 1. Satzzeichen entfernen
Der susse Brei (Meyer)    // 2. Umlaute ersetzen
susse Brei #Der (Meyer)   // 3. Artikel ans Ende, aber vor Klammerzusatz
susse Brei #Der #Meyer    // 4. Klammerzusatz auflösen
--Mapmarks (Diskussion) 20:22, 20. Jul. 2015 (CEST)
Ich habe nicht vor eine 10.000 Einträgeliste durch dich bearbeiten zu lassen. Die ersten beiden Schritte kann ich dir aber garantiert abnehmen. Den Rest kann ich mir zumindest vorstellen. Es ist auf jedenfall möglich die Änderung zu automatisieren und den erzeugten Sortkey auf einer Seite dir zur Ansicht zu überlassen. Dann musst du da nur drüber schauen und eventuell den ein oder andern Eintrag korrigieren. ... Das werde ich mal umsetzen und dann im Skriptorium vorlegen zur Genehmigung. --THE IT (Diskussion) 23:07, 20. Jul. 2015 (CEST)
(oben Umbrüche eingefügt)
Verstehe ich das richtig? Es soll dann drei Phasen geben:
  1. die automatische Suche nach Kandidaten mit dem Ergebnis einer 2-teiligen Liste (Seite/Sortierschlüssel),
  2. manuelle Kontrolle der Liste mit eventueller Korrektur der Schlüssel, und
  3. automatische Einsetzung der Schlüssel in die Seiten.

2. und 3. vertauscht. Falls Fehler auftauchen werden sie im Nachhinein korrigiert.--THE IT (Diskussion) 00:06, 21. Jul. 2015 (CEST)

Ich schätze man wird schon mit den Umlauten 90% aller Fälle erledigen können. Noch ein paar Fragen, die sich mir stellen:
  • Was wird nach einem ersten Durchgang mit den neu hinzukommenden Seiten?

Der Zeitraum lässt sich sehr scharf eingrenzen. Somit können neue Seiten iterativ bearbeitet werden.--THE IT (Diskussion) 00:06, 21. Jul. 2015 (CEST)

  • Wie kann man die älteren manuell sortierten vor der Wiedervorlage bewahren, damit man diese nicht unnützerweise immer wieder behandeln muss?

Ziel ist, wenn sie korrekt behandelt wurden, dass sie dann vom Skript ignoriert werden (siehe unten), für Sortierungen die zu speziell sind wird einfach ein spezieller Kommentar hinterlassen, der den Befehl zum ignorieren transportiert.--THE IT (Diskussion) 00:06, 21. Jul. 2015 (CEST)

  • Wichtig ist auch, dass Personenseiten zwecks abweichender Sortierung herausgenommen werden müssen. Also vielleicht Kategorie:Person von der Suche ausnehmen (Wie?) oder nur die Seiten aufnehmen, die in der Kategorie:Werke gelistet sind. – Das betrifft außerdem die ADB-, RE-, und MKL-Artikel, sowie alle Seiten mit Textdatenvorlagen, die entweder einen Parameter für Sortierung haben oder gar automatisch sortieren.

Heute habe ich nur die Seiten in der Kategorie Werke betrachtet. Das wäre auch einschränkbar auf die Seiten mit der Vorlage Textdaten, dass lässt alle anderen automatisch dann aus.--THE IT (Diskussion) 00:06, 21. Jul. 2015 (CEST)

  • Kann man auch falsche (manuelle) Sortierschlüssel automatisiert auffinden?

Folgendes Ginge:

  1. Analyse, ob die Seite manueller Sortierung bedarf
  2. Überprüfung, ob ein Sortkey gesetzt wurde
    1. JA
      1. schauen ob der automatisch kompilierte mit dem gesetzten übereinstimmt, wenn dies nicht der Fall ist
      2. Algorithmus anpassen eventuell und falls nicht behandelbar durch Skript ein Kommentar hinterlassen, damit der Algorithmus diesen Eintrag in Zukunft ignoriert.
    2. NEIN
      1. automatisch einen Sortkey hinzufügen und über eine Liste im Wiki wochenweise zur Kontrolle vorlegen.

--THE IT (Diskussion) 00:06, 21. Jul. 2015 (CEST)

--Mapmarks (Diskussion) 23:49, 20. Jul. 2015 (CEST)
Alle Fragen beantwortet danke! Klingt auch gut. Nur zur Info: Wo hinterlässt das Script einen Kommentar? --Mapmarks (Diskussion) 00:13, 21. Jul. 2015 (CEST)
Den hinterlässt der Kontrolleur, wenn er merkt, dass das Skript hier nicht weiter kommt. Aber das sollte dann wirklich nur bei einem Bruchteil der Seiten notwendig werden. --THE IT (Diskussion) 00:36, 21. Jul. 2015 (CEST)
Also Nachlese zu gestern: Benutzer:THE IT/Testgelände --THE IT (Diskussion) 09:25, 21. Jul. 2015 (CEST)
Wow, 10777 Einträge zähle ich, das sind gut ein Drittel aller Seiten in Kategorie:Werke – ich bedanke mich nochmal für Deine Hilfe und bin gespannt zu sehen wie es demnächst weitergeht. --Mapmarks (Diskussion) 16:40, 21. Jul. 2015 (CEST)
Du zählst richtig. Unsere umlautreiche Sprache führt sogar zu 13.000 Werken. Du bist also schon ganz gut mit den Sortierschlüsseln dabei.--THE IT (Diskussion) 19:24, 21. Jul. 2015 (CEST)