Zum Inhalt springen

Wikisource Diskussion:RE-Werkstatt/Pipeline

Seiteninhalte werden in anderen Sprachen nicht unterstützt.
Abschnitt hinzufügen
aus Wikisource, der freien Quellensammlung
Letzter Kommentar: vor 1 Jahr von Pfaerrich in Abschnitt Philol. Suppl.

Anleitung

[Bearbeiten]

Der Benutzer:ELexikon betreibt eine Software für grössere RE-Artikel, die guten Rohtext mit weniger Aufwand im Wiki-Format erstellt. Die Pipeline funktioniert analog zur Prozess Artikelwunsch. Ein Bearbeiter wünscht einen Artikel oder einen Bereich von Seiten. ELexikon füllt anschliessend die Pipeline, und der Bearbeiter kann die Artikel erstellen und rasch den Status korrigiert erreichen.

Vorteile: Die Arbeit mit dem OCR entfällt. Gleichzeitig sind der Block {{REDaten und viele [[Standard|Links]] im Text ergänzt, auch kursiv, {{SperrSchrift|}} und {{Polytonisch|}}, schliesslich sind Seitenumbruch und allfällige Zwischentitel eingefügt. Weil der Text noch nicht gelesen wurde, hat das Ergebnis den Status unkorrigiert, aber die Differenz zu korrigiert ist nicht mehr so gross. Der Aufwand pro Artikel sinkt gegenüber der Methode ,von Hand‘ massiv.

Nachteile: Das genaue Lesen bleibt (mehr als 4 Spalten sind anstrengend), ELexikon muss zuerst ‚an die Arbeit‘.

Aktivierung der Pipeline: Eine Anfrage auf der Seite Artikelwunsch genügt.

Verbesserungen

[Bearbeiten]

Zusätzliche Links bei Zeitschriften bieten eine win-win Situation – DANKE an die guten Seiten in WS! Beispiel:

  • Berl. Phil. W. = [Philologische Wochenschrift|Berl. Phil. W.]<!-Verlag S. Calvary-> und
Phil.-Vers. = [Philologenversammlung|Phil.-Vers.]
verhindern den antiken Autor an unpassender Stelle
Phil. = {RE siehe|Philon 41|Phil.}<!-w:Philon von Alexandria, † 40 n. Chr., agric., special, leg.->
  • Variationen werden ergänzt. Beispiel: Gött. Gel. Anzeig. / Gött. Gel. Anz. / Gött. gel. Anz.
  • Eine Abkürzung kann bis zu 7 Wörter umfassen, z. B. für den Artikel Ziegel von Rom und Umgebung

Was aufgefallen ist

[Bearbeiten]
  • RE:Etymologika statt bisher RE siehe ...
  • Vita S. Theod. dürfte Vita S. Theodosii abbatis a Theodoro ep. scripta sein
  • Dan. ist das Buch Daniel
  • Epiklesis, der Link auf Ἐπίκλησις schmeckt mir überhaupt nicht mehr, weil dieser in die Irre führt. ich verwende jetzt Epiklesis

Erledigt

[Bearbeiten]

Texte:

  • bei RE:Etruria #via etc. gingen die vorgeschlagenen Links sehr häufig komplett in die Irre, z.B. bei Aqua, Aquae-Orten
  • Male taugt nicht für den automatischen Transfer zu RE siehe|Male
  • eine Verlinkung von Monat oder Jahr ist nicht notwendig
  • Link auf Mühle kann man vergessen, es gibt offenbar keinen Artikel dafür
  • Decken wir mit Mythographie auch Myth. Vat. ab? Ich denke, das sind zwei verschiedene Dinge – ok
  • s. . statt s. o. – das geht sehr gut!
  • Traube darf nicht ungeprüft zu [Ludwig Traube (Philologe)| führen
  • Eros 1 Seite 517 Zeile 8 z. B. hast Du Dich wohl verritten mit Link auf [[RE:Epigramm#Seite_107| dort ist weit und breit nichts Brauchbares zu finden, sondern es geht wohl um einen Katalog oder Buch des Brit. Museum
  • ähnlich auch Imhoff-Blumer, Seite 517 Zeile 35 mit Ableitung auf Eremboi bz. Epikedeion
  • schon dutzendweise fand ich (s. ὁ. statt s. o.

Antikes:

  • Anton. Lib. sehe ich als Antonius 70, doch eher RE:Antoninus 17 stimmt!
  • [RE:Anthologia 1|Anth. Pal.] ist irreführend
  • Apul. lässt sich zu RE:Appuleius 9 verlinken
  • warum führt das Stichwort Argos gehäuft zu Argos 19? wo es dann nicht hingehört?
  • Aristophanes Byz. ist Aristophanes 14, nicht Aristophanes 12
  • [RE:Artemidoros 27|Artemidor] oneirocr. gehört in die Speisekarte
  • Vorsicht ist geboten zwischen Athen, und "Athen." bei der Ableitung zu der Stadt Athen oder zu Athenaios
  • Clemens Alex. ist Clemens 9, nicht Clemens 10
  • [RE:Diogenianos 4|Diogenian.] ebenso
  • Dion. perieg. ist Dionysios 94
  • Germ. abzuleiten auf Germanicae figlianae ist m.E. irrig, ich tippe auf w:Aratea des Germanicus, ein astronomisches Lehrgedicht
  • Germanos, Patriarch von Konstantinopel, ist nicht RE:Germanos
  • Londonium und andere lat. Namen von Städten, in denen Bücher der Neuzeit verlegt wurden, sind nicht zweckdienlich
  • Luk. = Lukianos von Samosata
  • Paul. Silent. in RE:Eunomos 10 deucht mich eher Paulus 10 als Iulius 382
  • Peplos ho 2 macht keinen Sinn. Müsste wenn, Peplos 2, besser noch Πέπλος 2 lauten, führt dann aber zu einer pseudo-aristotelischen Schrift; das Gewand ist Peplos 1, also Πέπλος 1.
  • Prob. deucht mich eher zu w:Marcus Valerius Probus, also Probus 26, als zu Aurelius 194 gehörig
  • Sen. ist meist auf Annaeus 16 abgeleitet, das ist Seneca der Ältere. Ihm sind eigen die Werke controv. Suasor, historiae. Sen. der Jüngere = Annaeus 17 dagegen ist mit einer Fülle von Werken am Markt wie de Prov., de const. sap, de consol. de vita beata.
  • Sueton hat mit Suevi nichts am Hut
  • Sulla als Politiker/Militär ist nicht RE:Sulla sondern RE:Cornelius 392
  • Tacitus der Schriftsteller ist Cornelius 395, nicht der Kaiser Tacitus
  • Theod. Prisc. eher nicht Theodoretos 1, sondern Theodoros 46
  • L. Aurelius Verus ist Ceionius 8
  • Victor Caes. dürfte Victor 69 sein

Autoren der Neuzeit:

  • K. Bruhns = K. [Karl Christian Bruhns|Bruhns]
  • Cauer Del. stammt von Paul Cauer, nicht von Friedrich Cauer
  • Johann Gustav Droysen ist für Alexander d.G. zuständig, nicht Hans Droysen
  • Friedländer und Sittengeschichte ist eindeutig Ludwig Friedländer
  • Gerhard: Auserlesene Vasenbilder gehören zu Eduard Gerhard
  • Gustav Hirschfeld und Otto Hirschfeld sind zwei Paar Stiefel
  • Mit Köhler ist in aller Regel Ulrich Köhler gemeint
  • Marx Wiener Stud. sind wohl von Friedrich Marx, nicht August Marx
  • C. Müller ist wohl der besagte Karl Müller, nicht Carl Friedrich Wilhelm M.
  • Preller-Robert: da unterschlägst Du den Carl Robert
  • vergleichbar auch für Hitzig-Blümner, wo Blümner zu kurz kommt
  • August und Theodor Mommsen sind zwei Paar Stiefel
  • A. Philippson ist nicht Robert Philippson
  • Fr. Rühl ist [Franz Rühl|Rühl]
  • A. Schmidt ist [Wilhelm Adolf Schmidt]

Philol. Suppl.

[Bearbeiten]

Die Ableitung Philol. Suppl. auf Philologus deucht mich falsch. Am Beispiel Oder in RE:Etesiae finde ich Philol. suppl. VII. Philologus (alt) beginnt im Jahr 1846, da lebte Oder noch nicht, Philologus suppl. gibt es erst seit 2014. Irgendetwas passt da nicht zusammen. Unter w:Eugen Oder wird ausgeführt, dass er u.a. Beiträge für die Zeitschrift Rheinisches Museum für Philologie geliefert hat. Könnte es das sein? aber die Abkürzung Philol. Suppl. bringt in der Suche nichts Brauchbares. Jahrb. f. klass. Philol., Suppl. XXII 1895 finde ich unter https://www.asclepiosedition.de/philosophie/Karl_Muenscher_Senecas_Werke.pdf, aber deren Band VII erschien 1875, da war Eugen zarte 13 Jahre alt.

ja, das widerlegt mich, das würde dann aber heißen, dass wir beim Lemma über Oder auch den Philologus erwähnen müssten. Und ist der Philol. Suppl. VII schon irgendwo im Internet auffindbar? Apropos: danke sehr für Deine Aufmerksamkeit, die mich immer wieder in blankes Erstaunen versetzt. Pfaerrich (Diskussion) 07:14, 21. Dez. 2022 (CET)Beantworten
nachgekartet: bin unter https://www.degruyter.com/serial/phsup-b/html#volumes zwar fündig geworden, doch weder in dessen Inhaltsverzeichnis noch auf Seite 290 ist von Oder eine Spur. Pfaerrich (Diskussion) 07:53, 21. Dez. 2022 (CET)Beantworten

Grenzen

[Bearbeiten]

Der OCR kann nicht Alles auflösen:

  • Gleichheitszeichen im Polytonischen kann auch mit {{=}} dargestellt werden
  • für den Münzrevers gibt es das Sonderzeichen
  • Altgriechisch Sonderzeichen wie Ϝ ϝ Ϙ ϙ Ϡ ϡ z. B. für Ἀθανα Ϝαργανα im Lemma RE:Ergane
  • nicht alles, was sich Gruppe schreibt, ist Otto Gruppe. Vielleicht auf Sperrschrift achten, ob Ableitung erfolgen soll oder nicht. Gleiches bei Oder, den ich auch mehrfach aus dem Verkehr ziehen musste. Ebeso Ihm am Anfang eines Satzes, wenn der erste Buchstabe des Adjektivs oder Pronomens gross geschrieben wird. => Die Sperrschrift bei den Autoren Gruppe, Oder, Ihm liefert der OCR leider nicht.

Warteliste:

  • {SperrSchrift|Perdrizet} Mélanges Perrot statt Perdrizet Mélanges {SperrSchrift|Perrot}
  • de benef. gehört zu Annaeus 17, nicht zu 16
  • Dict. im Zusammenhang mit Daremberg-Saglio ist Abk. für Dictionnaire, Ableitung zu Diktys ist hier abwegig
  • Karten öfters entdeckt als OCR-Fehler für Karien
  • Kato steht für nieder, also Kato Uzwil wäre Niederuzwil
  • Klein im Zusammenhang mit Arch. epigr. Mitt. führt zu Wilhelm Klein. siehe https://digi.ub.uni-heidelberg.de/diglit/archepigrmoeu1885
  • Prax. in Verbindung mit Josef Klein: es geht um Wilhelm Klein (1850-1924) https://archive.org/details/praxiteles00kleigoog/page/n12/mode/2up
  • Schäfer, eig. Schaefer, im Zusammenhang mit Dem. ist Arnold Dietrich Schaefer

Was ist richtig?

  • Antiph. => [RE:Antiphon 14|Antiph.]<--2x, w:Antiphon von Rhamnus, 480-411, Redner-->
oder => '[RE:Antiphanes 15|Antiph.]',
  • Cels. => [RE:Iuventius 12|Cels.]
oder => [RE:Cornelius 82|Cels.]<--2x, Celsus, w:Aulus Cornel. Celsus, † 50 n. Chr., de medicina, artes-->
  • Pallad. => {RE siehe|Palladios 5|Pallad.}<--2x, w:Palladius (Schriftsteller) 450 n. Chr., Rutilius, De re rustica-->
oder => {RE siehe|Palladios 7|Pallad.}

ELexikon hat hier zwei Optionen: Eine Abkürzung auswählen oder beide weglassen. Denn das Programm kann den Kontext nicht erkennen, höchstens das Lemma und die vorhergehenden oder folgenden 2 bis 3 Worte.

Automatische Verlinkung

[Bearbeiten]

Eine automatische Verlinkung erfolgt gemäss Wikisource:RE-Werkstatt/Anleitung#Verlinkung, bevor die Pipleline gefüllt wird:

  1. Der OCR markiert Stellen, die unsicher sind. Diese Stellen korrigert eLexikon vorab, diagonal lesend.
  2. Der OCR transkribiert nach Neugriechisch, mit Grammatik und Software wird daraus Altgriechisch.
  3. θ wird schlecht erkannt und mit ῦ oder ähnlich verwechselt.
  4. Griechische Wörter, mit Vokal beginnend, haben immer Spiritus lenis, ein beginnendes h = asper wird nicht erkannt.
  5. Häufige, kurze griechische Wörter erhalten gemäss Liste die korrekten Akzenten und den Spiritus