Wikisource Diskussion:Musik-Werkstatt/AMZ
Abschnitt hinzufügenLetzter Kommentar: vor 14 Jahren von Konrad Stein in Abschnitt Zweite Beobachtungen
Erste Beobachtungen[Bearbeiten]
- Der Jahrgang 1882 hatte fast 3000KB, war also zu groß (max. ist 2000KB), mußte also gesplittet werden.
- Die OCR von zwei verschiedenen Exemplaren kann völlig verschiedene Stärken oder Schwächen haben.
- Es fehlen bei der OCR manchmal Hunderte von Seiten (fehlen die Seiten auch im Exemplar?), daher ist vielleicht das Ernten der OCR des Gesamtbestandes sinnvoll.
- Problematisch sind Inhaltsverzeichnisse, Notenbeispiele/Tabellen/Abbildungen und Verlagsanzeigen. Am wenigsten fehleranfällig breitlaufender Text von Aufsätzen.
--Konrad Stein 21:27, 23. Jul. 2009 (CEST)
Zweite Beobachtungen[Bearbeiten]
- Es lohnt sich, um den Salat zu gliedern, irritierende Zeichen wie spitze Klammern <> oder * zu entfernen.
- Und die Hefte durch Kapitel == zu trennen --Konrad Stein 19:42, 4. Aug. 2009 (CEST)