Zum Inhalt springen

Wikisource:RE-Werkstatt/Test

aus Wikisource, der freien Quellensammlung
Realencyclopädie der classischen Altertumswissenschaft
[[Bild:{{{BILD}}}|220px|Realencyclopädie der classischen Altertumswissenschaft]]
Ergebnisse, Output und Hinweise zur Nutzung
{{{SONSTIGES}}}
[[c:{{{COMMONS}}}|Bilder und Medien bei Commons]]
[[q:{{{WIKIQUOTE}}}|Zitate bei Wikiquote]]
Eintrag in der GND: {{{GND}}}
Weitere Angebote

Vorlage:REabc

[Bearbeiten]

Siehe die Diskussion zur Vorlage:REDaten.

Forschung Sachgebiet

[Bearbeiten]

In der Uni-Bibliothek ist ein Band I "Gesamtregister je Artikel" greifbar, gedruckt im Jahr 1997 mit den gesammelten Kurztexten auf rund 1000 Seiten, der eine separate CD-ROM erwähnt. Diese elektronische Basis ist mir zugänglich, ein ganz primitiver Auszug ist als ‚RE-5_Gesamt-Reg-ABC-CD1.xlsx‘ gespeichert. Wegen grosser Mängel im Zeichensatz ist der Auszug nur informativ zum Nachschlagen und nicht wirklich brauchbar.

Spannender ist Band II "Gesamtregister nach Sachgebiet" auf einer zweiten CD-ROM. Offenbar existiert keine gedruckte Ausgabe, und Windows meldet bei „setup.exe“ hartnäckig in einer blauen Box: „Diese App kann auf dem PC nicht ausgeführt werden, wenden Sie sich an den Softwareherausgeber, um eine geeignete Version für ihren PC zu finden“ – mit der einzigen Auswahl ‚Schließen‘. Google meint, das Problem sei 32-Bit Software auf 64-Bit Hardware und liefert einen 10 Punkte Plan. Meine Versuche als Administrator mit geänderten Einstellungen im Kompatibilitätsmodus sind erfolglos.

spontane Idee virtuelle Maschine mit einem guten alten Windows XP? --THE IT (Diskussion) 21:36, 5. Mai 2022 (CEST)[Beantworten]
Danke viel mal, das ist die Lösung! Die virtuelle Maschine funktioniert gut. Doch das Lernen mit Youtube braucht immer wieder Geduld und Ausdauer ... ELexikon (Diskussion) 08:36, 28. Mai 2022 (CEST)[Beantworten]

WIKIDATA

[Bearbeiten]

verschoben auf d:Wikidata talk:WikiProject Antiquity/Pauly-Wissowa.

Qualität je Seite siehe RE-7_OCR-Erfolg.xlsx mit der Fehlerliste RE-7_OCR-Erfolg.html.

Seiten: Text II,1_17
OCR netto: II,1_17 oder I A,1_0012 = I A,1_12 = IA,1_12

Summary je Artikel

[Bearbeiten]

Siehe Wikisource:RE-Werkstatt/Nachweise und das Beispiel VIII,1_0897.

RE:Schlange oder RE:Kallisthenes 2 mit OCR füllen: siehe Schlange oder Kallisthenes 2

Einleitungen extrahieren

[Bearbeiten]

Das Ziel ist es lange Einleitungen zu Lemma mit mehreren Teilen vom ersten Lemma zu trennen. Dies ist nicht durchgängig auf alle vorhandenen Lemma angewendet. Daher wollen wir vorhandene Lemma die auf " 1" enden prüfen, ob eine eventuelle Einleitung raus gezogen werden muss.

Query bearbeitet bis Ag.

Beispiel für Extraktion: Abrogation, Abrogatio 1

Bildergalerie

[Bearbeiten]

Beschreibung

[Bearbeiten]

1. Mit https://elexikon.ch/meyers/RE/II,1_1.png wird Scan einer einzelnen Seite im Format .PNG direkt aufgerufen. Diese Basis hat keine optionalen Parameter, die Namenskonvention ist fix, Ergänzungen durch zusätzliche Bilder sind denkbar, vgl. Forschung.

2. Für alle Scan ist ein kleines Vorschaubild verfügbar. Der direkte Link auf eine Vorschau lautet https://elexikon.ch/meyers/REk/II,1_1.png mit /meyers/REk/ an der Stelle von /meyers/RE/. Die definitive Grösse gemessen in Pixel kann sich ändern, z. B. eher 100px statt 150px hoch.

3. Der Server eLexikon.ch kann vorwärts und rückwärts blättern sowie gezielt springen.

Der dazugehörige Link ist ähnlich zum Einzelbild, der Term »/meyers« für eine einzelne Datei muss entfernt werden. Zudem ist das ».png« im Link für das Blättern optional. Damit wird in den Registern etwas Speicherplatz eingespart. Bei Gelegenheit können die bisherigen Verweise auf die neue Variante gekürzt werden, also neu ohne „/meryers“ und ohne „.png“.

4. Die Bildergalerie https://elexikon.ch/RE/II,1_1?Galery ist produktiv. Beispiele

Die Galerie zeigt jeweils 10 Vorschaubilder (mit je einer Anschlussseite vorne und hinten sind es 12), Blättern mit ⏪ und ⏩.

Weiterentwicklung

[Bearbeiten]

Rund 10 Punkte sind zur Weiterentwicklung notiert, gegliedert nach Funktionalität (A.*), Usability (B.*) und Erweiterungen (C.*). Neue Versionen werden üblicherweise am Morgen eingespielt, damit ist tagsüber die gewünschte Stabilität sichergestellt.

A = Funktionalität, prioritär:

  • A.1 Der RE-Band XVIII mit den 4 Teilen hat Bugs (to do)
  • A.2 Die Nachträge je Gesamtband, oft sind es zwei, werden nicht vollständig und korrekt angezeigt.

B = Usability, wenn möglich:

  • B.1 Die Optionen ?Big und ?Galery sowie die Einstellungen Details Band/Seite, Alphabet mit ?opena und ?openb sind nicht genügend stabil
  • B.2 Unglückliche oder fehlende Titel bei ergänzenden Seiten
  • B.3 Was ist die optimale Grösse der Vorschaubilder? Aktuell sind alle Vorschaubilder genau 150px hoch. Wäre grösser besser? oder doch weniger Pixel?
  • B.4 Das Erlebnis beim »Blättern mit Delta« am Anfang und Schluss des Bandes kann verbessert werden.
  • B.5 Von der Galerie direkt zum Grossen Bild (?Big)

C = Erweiterungen, zu gegebener Zeit:

  • C.1 Responive Design
  • C.2 Wartungskonzept, Aktualisierung
  • C.3 Alphabetisches Inhaltsverzeichnis zur Galerie: Alle 10 Scan = alle 40 Seiten.

Gerne erwarte ich Anregungen und Kritik. --ELexikon (Diskussion) 20:44, 18. Apr. 2022 (CEST)[Beantworten]

Dokumentation

[Bearbeiten]

Zuerst werden aus Wikisource Informationen gesammelt, hauptsächlich aus den RE-Registern. Anschliessend werden die verfügbaren Bilddateien gezählt, massgebend ist der lokale PC von eLexikon. Auf dem Internetserver .ch liegen das Original und ein kleines Vorschaubild, das 150 Pixel hoch ist. Die Breite ist abhängig vom Bild variabel.

Die Schnittstelle bzw. der Datenfluss zwischen Wikisource und eLexikon bilden Listen (Arrays), welche alle 27555 (bzw. 27618) Bilddateien *.png durchnummerieren, und diesem internen Schlüssel den Dateinamen, Titel, die Sortierreihenfolge und das alphabetische Register zuordnen. Beispielhaft ist der folgende Auszug:

"Dateiname" = array
    1 =>'I,1_0'
    2 =>'I,1_0-1'     ...
 3453 =>'VA,1_1269'   ...
 4546 =>'SI_5'        ...
27555 =>'R_251' 
               und
"Titel" = array
    1 =>'Titel I'
    2 =>'I,1_0-1'
    3 =>'Vorwort (I)' ...
   10 =>'Aal'
   11 =>'Aal'
   12 =>'Abacus 9'
   13 =>'Abaesamis'   ... 
27555 =>'Autoren (R)'

Der Server eLexikon.ch erledigt folgendes:

Archiv

[Bearbeiten]

Band R

[Bearbeiten]

Nach einigen Korrekturen, mit neuer Software sowie

sowie den technischen Dateien

hat das Projekt „neuer Registerband R“ in den Modus Betrieb gewechselt.

Hürden

[Bearbeiten]

Einige Hürden sind erfolgreich umschifft:

Datei:Bsp XXIV 301.png

<img src="https://elexikon.ch/meyers/RE/II,1_1.png" />

Der Entwurf „Seitenlisten als Tabelle“ ist im Archiv der Wikisource:RE-Werkstatt gelandet. Dort sind die grundlegenden Grenzen und Mängel dokumentiert. Wie sagt man: Besser ein Ende mit Schrecken als ein Schrecken ohne Ende. Immerhin gab jenes Muster den Anstoss zu dieser interaktiven Lösung. Verschiedene Konzepte konnten übernommen werden.