Diskussion:Die Grenzboten
Abschnitt hinzufügenhttp://catalog.hathitrust.org/Record/007914762
Editionsrichtlinien
[Bearbeiten]Ich habe mir erlaubt die Editionsrichtlinien nach jetzigem Diskussionsstand zusammenzufassen und – aufgrund erster Editionserfahrung – anzupassen. Dazu habe ich in einzelne Diskussionsbeiträge eingegriffen um Verwirrungen zu vermeiden. Ich hoffe, das ist in Ordnung. Auch diese Editionsrichtlinien sind natürlich diskussionswürdig (besonders die Formatierung der Überschriften). --Konrad Stein (Diskussion) 18:11, 3. Jan. 2014 (CET)
Bände
[Bearbeiten]- Für jeden Einzelband wird ein eigener Index angelegt.
- Bände, die nicht vollständig transkribiert werden sollen, sind mit der Kategorie „Unvollständig (geplant)“ gekennzeichnet.
- Bände werden angelegt nach dem Schema:
Die Grenzboten Jahrgang-Jahr-Band.pdf
Beispiel:
Die Grenzboten 4-1845-4.pdf
- Da die Zeitschrift erst ab dem 4. Jahrgang zu regelmäßigen Quartalsbänden findet, hier das Schema für die ersten drei Jahrgänge:
Die Grenzboten 1-1841.pdf [bereits angelegt]
Die Grenzboten 1-1842-2.pdf [wurde nachträglich umnummeriert; 1841/42 bilden den 1. Jg.]
Die Grenzboten 1-1842-3.pdf
Die Grenzboten 2-1843.pdf [es gab nur einen Band, einen Jahresband mithin]
Die Grenzboten 3-1844-1.pdf [I. Semester, ein Halbjahresband]
Die Grenzboten 3-1844-2.pdf [II. Semester, I. Band; ein Quartalssband]
Die Grenzboten 3-1844-3.pdf
dann: Die Grenzboten 4-1845-1.pdf bis -4 usw.
- Jeder Jahrgang bekommt eine eigene Projektseite und fasst die dazu gehörigen Einzelbände zusammen.
- Angelegte Einzelbände werden im Gesamtinhaltsverzeichnis verlinkt.
Artikel
[Bearbeiten]- Werden einzelne Artikel der Grenzboten ediert, ist das Anlegen des Gesamtbandes („Unvollständig (geplant)“) wünschenswert – vorausgesetzt, die SUUB unterstützt uns weiterhin mit der Bereitstellung von ganzen Bänden.
- Jeder Artikel erhält eine eigene Projektseite. Sie wird nach dem Titel benannt.
- Untertitel entfallen
- Bei Fortsetzungen wird einfach arabisch durchgezählt
- Beispiel: Aus Briefe aus Antwerpen: aus den Papieren eines reisenden Deutschen. I wird: Briefe aus Antwerpen, denn Untertitel entfällt und eine zweite Folge hat es nicht gegeben (läßt sich per Gesamtinhaltsverzeichnis prüfen).
- Beispiel 2: Aus Literarische Uebersichten vom Standpuncte der Gesellschaft. 2.: Fürst Lichnowky und seine Erinnerungen. wird: Literarische Uebersichten vom Standpuncte der Gesellschaft 2
- Wiederkehrende Glossen oder Kolumnen werden nach Jahr und Band durchnummeriert. Beispiel: Die vierte Rezensionsabteilung im 4. Quartalsband 1869 heißt: Literatur 1869-4 4. Desgleichen Tagebuch, Correspondenzen und Notizen etc.
- Die Artikel werden per Navigation mit VORIGER und NÄCHSTER verknüpft.
- Sind die Verfasser durch Chiffren gekennzeichnet, werden diese zeichengenau angegeben. Lassen sich Chiffren auflösen, wird der Klarname in Klammern hinzugesetzt.
- Ist weder Verfasser noch eine Chiffre gegeben, wird "Anonymus" als Autor eingetragen.
- Artikel (und Autoren mit eigener Seite) werden im Gesamtinhaltsverzeichnis verlinkt.
Text
[Bearbeiten]- Die Seiten werden bis auf das Auflösen von Trennungen zeilengenau transkribiert. Am Ende einer Zeile im Scan erfolgt eine neue Zeile in der Transkribtion
- An Textauszeichnungen wird gesperrt zu kursiv.
- Überschriften werden einheitlich gesetzt:
- Überschriften: {{LineCenterSize|140|20|'''xxx'''}}
- Untertitel: {{LineCenterSize|100|20|'''xxx'''}}, ohne Leerzeilen unter die Überschrift
- Zwischen Überschriften und Text werden zwei Leerzeilen geschaltet.
- Linien zwischen Titel und Untertitel, bzw. Untertitel und Text entfallen.
- Die Artikel werden durch {{Linie}} abgeschlossen.
- Die Sektionszählung beginnt mit 1, für jeden Abschnitt wird der Zähler um 1 erhöht.
- Seiten die nur einen Abschnitt haben bekommen keine Sektionszählung.
- Jedem Text eines Scans ist eine Sektion zuzuordnen.
- Beispiel
<section begin=1 /> <section end=1 />
- Es gibt für die Artikel analog zur ADB eigene Kategorien für fertig, korrigiert etc.
- Eckige Klammern [] sind Zusätze des Wikisource-Bearbeiters.
- Bei den Autoren-Chiffren kann jedes „I.“ auch ein „J.“ sein – und umgekehrt
- weitere Formatierungen
- {{Right|Text}}
- {{center|Text}}
- Falls Bilder auftauchen werden mit der Vorlage BRU eingefügt, aus diesem Grund enthält das Bild selber keinen Text
{{BRU|Die Grenzboten () b .jpg|center|500|''' '''<br />||center}}- {{BRU|Die Grenzboten () b .jpg|center|500|''' '''<br />||center}}
- Falls Spalten auftreten wird der Spaltenumbruch unsichtbar markiert {{nSp}}
Bemerkungen
[Bearbeiten]Wenn ich es auf der Wikisource Tagung richtig verstanden habe, wollen wir zumindest aus dem ersten Band einiges bei uns transscribieren sonst nur auszugsweise. Dazu sollten wir vorher die Editionsrichtlinien inclusive Formatierung der Überschriften, der zu nutzenden Vorlagen, und die Art der Sektionstags festlegen. Der Sinn dahinter ist es die Übernahme der Texte in beiden Richtungen so reibungsfrei wie möglich zu gestalten, da dies auf automatischen Prozessen beruhen soll, ist eine höhere Formalität - die uns aber meiner Meinung n ach nicht einschränkt - notwendig. --Jörgens.Mi Talk 12:04, 22. Okt. 2013 (CEST)
Als Grundlage können die Editionsrichtlinien der Gartenlaube dienen.
Hinzufügen möchte ich jetzt schon:
- Die Seiten werden bis auf das Auflösen von Trennungen zeilengenau transskribiert. Am Ende einer Zeile im Scan erfolgt eine neue Zeile in der Transscription
- Bilder werden mit der Vorlage BRU eingefügt, aus diesem Grund enthält das Bild selber keinen Text
{{BRU|Die Grenzboten () b .jpg|center|500|''' '''<br />||center}} - Überschriften werden einheitlich mit .... gesetzt
* Die Sektionszählung beginnt auf jeder Seite neu mit t1, für jeden Abschnitt wird der Zähler um 1 erhöht.
* Seiten die nur einen Abschnitt haben bekommen auch die Sektionszählung.
* Jeglichem Text eines Scans ist eine Sektion zuzuordnen.
- Es gibt für die Artikel analog zur ADB eigene Kategorien für fertig, korrigiert,...
Beispiel
<s><section begin=t1 /></s> <s><section end=t1 /></s>
Folgende Vorlagen sind verbindlich
[Bearbeiten]- {{BRU|Die Grenzboten () b .jpg|center|500|''' '''<br />||center}}
- {{Right|Text}}
- {{center|Text}}
- ....
Diese Liste ist sicher nicht vollständig und sollte erweitert werden. Der Einsatz von weiteren Vorlagen sollte vorher hier bekanntgegeben werden. Es sollen nur nur dokumentierte Vorlagen genutzt werden.
- Bilder und Spalten habe ich da noch nie gesehen, in welchen Bänden kommen die vor? --Jowinix 00:07, 7. Nov. 2013 (CET)
- Ich habe die Texte nicht alle durchgeschaut, wenn es keine Bilder geben sollte, kann das natürlich raus. Die meisten Punkte sind als Grundlage aus der Gartenlaube übernommen und präzisiert. --Jörgens.Mi Talk 07:11, 7. Nov. 2013 (CET)
Seiten die nur einen fortlaufenden Text enthalten müssen nicht in Sektionen verpackt werden. Und wenn Sektionen, dann müssen die auch nicht mit "t" beginnen, da reicht einfach nur die Zahl. – Paulis 17:12, 11. Nov. 2013 (CET)
- Sehe auch auch so. --Jowinix 17:31, 11. Nov. 2013 (CET)
Fragen zum Projekt
[Bearbeiten]von hier Benutzer_Diskussion:Joergens.mi#Die_Grenzboten hierher verschoben.
Wenn ich schonmal hier bin :->. Ist hier der richtige Ort für dumme Fragen, ist die Disk. der Grenzboten der richtige Ort oder ist es noch viel zu früh für dumme Fragen zu diesem potentiellen Projekt. --Maasikaru (Diskussion) 05:54, 5. Nov. 2013 (CET)
Ist eine gute Frage, prinzipell ist es besser Fragen zum Projekt hier Diskussion:Die_Grenzboten zu stellen, aber wenn du dir nicht sicher bist auch gerne hier. Ich kanns bei Bedarf ja verschieben.
- Vorab: Mit einem herzhaften "Wart's ab!" oder einem bestimmten "Januar" kann ich umgehen. Trotzdem ein paar Fragen und Meinungen. Bei der Sichtung der Inhaltsverzeichnisse habe ich einiges gefunden, wo ich grosse Lust drauf hätte. Gleichzeitig verstehe ich die mahnenden Worte, dass wir uns da nicht überheben sollten. Angedacht ist ein Musterband (?). Könnten wir nicht lustorientiertes Arbeiten in den Nutzen der Sache stellen: Wer einen selbst ausgesuchten Artikel in Angriff nimmt, verpflichtet sich zu Zweit-oder Drittkorrektur an einem anderen Artikel oder zur Erstellung eines weiteren Artikels im Musterband. Ich kann mir vorstellen, dass eine wenig restriktive Herangehensweise neue Mitarbeitende anziehen könnte oder die Aufteilung der "Arbeits"leistung für verschiedene Projekte, wie bei mir, positiv zugunsten WS beeinflussen würde.
- Wie wird das nun aufgegleist? Hat _hier_ jemand die Federführung? Was ist unter dem teilautomatisierten Austausch zu verstehen? Wie kommen die Roh-OCRs nach wikisource? Bleiben die PDFs in Bremen? Ich würde mir Festlegungen wünschen, ob WS-links, WS-ADB-Links auf Personen gewünscht sind oder nicht? 2,3 Musterartikel zum Abschauen. Wie gesagt: "Januar" ist auch eine Antwort ... freundliche Grüsse. --Maasikaru (Diskussion) 08:09, 6. Nov. 2013 (CET)
- PS. Könntest Du hier eins drüber, hier und hier bitte noch schauen. Danke. --Maasikaru (Diskussion) 08:09, 6. Nov. 2013 (CET)
Ich helfe gerne mit, sowohl technisch aus auch mit Transscription.
Wie die Seiten eingebunden werden, ist noch nicht geklärt. Aus schlechten Erfahrungen tendieren wird dazu die zu transkribierenden Seiten nach commons zu legen. Uns sind des öfteren externe angeblich ewige Links um die Ohren geflogen, weil man im anbietenden System eine gute Idee zu einer Änderung hatte. Aber das ist eigentlich ein Community Enscheidung über das Scriptorium.
Ich meine folgendes geschrieben zu haben (einfach mal kopieren :) Wenn ich es auf der Wikisource Tagung richtig verstanden habe, wollen wir zumindest aus dem ersten Band einiges bei uns transscribieren sonst nur auszugsweise.. Das steht doch deinen Wünschen nicht entgegen. Meine persönliche Meinung ist - neben den interessanten Artikeln quer durch - der erste Band als Teaser sehr schön wäre - das Urstück von allem. Mit einem Band kann man dann gute Werbung machen. Das Lust-prinzip ist das einzige was wirklich funktioniert.
Wie und wann es los geht ist eine Frage des Interesses, dazu müsste aber jemand mit Herzblut das Projekt im Scriptorium vorstellen und die Gemeinschaft einer auszugsweisen Transscription zustimmen.
Da ich schon in zwei Großprojekten Gartenlaube, Topographia tätig bin, bin ich nicht der Richtige das anzuschieben.
Wenn wir wissen, wo die Roh-OCR's zugreifbar sind, holen wir die relativ einfach dort selber passend zur Seite ab. Ist die Roh-OCR im PDF enthalten und selbige auf Commons so wird sie beim ersten öffnen der Seite automatisch eingefügt. Habe ich gerade bei einem 3 Seiter ( Index:Lariophagus distinguendes (F. Ruschka) ) erlebt. Ob das auch extern pdf's funktioniert, weis ich (noch) nicht.
Natürlich werden die PDF'S in Bremen bleiben, selbst wenn wir die zu bearbeitenden pdfs nach Commons kopieren, werden wir die in Bremen nicht löschen :)
Deine Wünsche bezüglich WS-links, ... werden wir im Scriptorium / auf der Diskussionsseite Die Grenzboten diskutieren und in den ER festgelegt. Siehe zum Beispiel die Liste der zu nutzenden Vorlagen. Das sollten wir gemeinsam entscheiden.
Zu deinem ersten Link, ich habe das was dazu geschrieben, dein zweiter Link, prinzipiell sieht es gut aus, für den zweiten Korrekturdurchlauf habe ich im Moment keine Zeit.
Ich hoffe alles sinnvoll beantwortet zu haben, aber bitte weiterfragen. Wahrscheinlich werde ich die Texte von hier bald auf die Diskussionsseite verlagern, damit alle Interessierten sie dort finden können. --Jörgens.Mi Talk 18:21, 6. Nov. 2013 (CET)
- Der Text (OCR) ist im PDF enthalten (zumindest bei denen ich ich probiert habe) --Jowinix 18:40, 6. Nov. 2013 (CET)
Herzlichen Dank, dass Du Dir Zeit für Deine ausführliche Darstellung genommen hast. Ich freue mich darauf, wenn dieses Projekt zustande kommt, Mangels ausreichendem Verständnis der technischen Hintergründe tauge ich allenfalls als Anschieber-Anschieber :->; ich kann hingegen willige und fleissige Artikelarbeit 1) nach Lust und 2) im Dienste dieses Projekts in Aussicht stellen. Verschieben dieses Textes auf Grenzboten-Disk. erscheint mir sinnvoll. --Maasikaru (Diskussion) 06:00, 7. Nov. 2013 (CET)
- Ich wäre auf jeden Fall auch dabei fleißig zu korrigieren, wenn es denn mal losgeht. --Arnd 10:20, 11. Nov. 2013 (CET)
--Manfred Nölte (Diskussion) : Hallo, schöne Grüße von der Staats- und Universitätsbibliothek Bremen, der Quelle des "digitalen Grenzboten". Gerne stehe ich auch bei Fragen zur Verfügung (am Anfang eher per Email und Telefon, später hoffentlich auch über die Diskussionsseiten). Den Transfer des Volltextes für den 1. Band würde ich gerne unterstützen, kenne bisher jedoch die technischen Anforderungen seitens Wikisource nicht. Siehe meine Kontaktdaten hier: --Manfred Nölte (Diskussion) 16:41, 11. Nov. 2013 (CET)
Typos
[Bearbeiten]Hallo zusammen, ich habe die Inhaltsverzeichnisse bzgl. offensichtlichen Typos überarbeitet. Da ich bei der Vorstellung des Projekts nicht dabei war, ist mir nicht klar inwiefern diese Korrekturen zur SUUB zurückfließen können bzw. sollen. --Arnd 10:48, 13. Nov. 2013 (CET)
- Liebe WS-Grenzboten-Interessierte, auf jeden Fall werden die Korrekturen berücksichtigt, die ihr in WS an den Inhaltsverzeichnissen vornehmt! Bei der momentan parallel in Berlin (BBAW, DTA) und Bremen (SuUB) laufenden Bearbeitung der Daten wird es voraussichtlich so sein, dass eure Korrekturen über das DTA in die METS-Dateien zurückfließen und die korrigierten METS-Dateien dann auch Bremen zur Aktualisierung auf der Bremer Grenzboten-Seite zur Verfügung gestellt werden. Vielen Dank für euer bisheriges und hoffentlich weiteres Engagement und viele Grüße aus dem DTA! --Newdta (Diskussion) 17:34, 29. Nov. 2013 (CET)
- Jede Form von Resonanz motiviert. Daher: Dank zurück. Und: Weiter geht’s. --Konrad Stein (Diskussion) 00:31, 30. Nov. 2013 (CET)
Inhaltsverzeichnis
[Bearbeiten]Ich bin dafür das Inhaltsverzeichnis weiter aufzusplitten, z. B. in 10-Jahres-Abschnitte. Denn bei der Vorschau, beim Speichern usw. gibt es Probleme ob der Größe des Quelltextes. --Arnd 12:31, 13. Nov. 2013 (CET)
- bin auch dafür, das Inhaltsverzeichnis weiter aufzusplitten, z. B. in 10-Jahres-Abschnitte; habe Probleme gehabt (Bearbeitungskonflikte, wo keine waren, Server-Timeout etc.). Grüße --Lit cht (Diskussion) 14:27, 13. Nov. 2013 (CET)
- Das ist doch nach Jahrzehnt und Jahr eingeteilt, die Abschnitte kann man also auch einzeln bearbeiten! --Jowinix 14:45, 13. Nov. 2013 (CET)
- Die Server-Probleme habe ich auch (aber auch unabhängig von der realen Größe der jeweiligen Seite), ich habe den Eindruck, dass Wikimedia gerade in einer Zwickmühle steckt. Vielleicht ist aber auch die große Zahl an Vorlagen ein Problem. Die Inhaltsverzeichnisse auf 10Jahresseiten herunterzubrechen fände ich unbefriedigend, denn da müsste man ja 8mal die Seite wechseln bis man mit einem Autor/Thema suchend durch wäre. Vielleicht wären 30Jahresschritte praktischer. Man kann zwar jahresweise Abschnitte bearbeiten, aber es scheint so, als würde dann doch immer die Gesamtseite abgespeichert. Viele Grüße --Konrad Stein (Diskussion) 21:10, 14. Nov. 2013 (CET)
- Zu blöd, bemerke eben erst, dass die 30Jahresschritte ja bereits status quo sind. --Konrad Stein (Diskussion) 01:05, 28. Nov. 2013 (CET)
E-Text
[Bearbeiten]Wenn wir ein komplettes Pdf mit unterlegter OCR hätten, könnten Seiten nach Bedarf angelegt werden. D.h. Wenn man bei einer Seite auf "bearbeiten" drückt, extrahiert sich der Text in das Editierfenster und kann weiterbearbeitet werden. Somit könnten wir für jeden Jahrgang einen Index anlegen und wer möchte, legt nach Interesse Seite und Artikel an. Vorteil ist, dass wir alle Bände vorbereitet in Vorhaltung hätten, wovon aber nicht alle Seiten angelegt sein müssen und auch nirgends die OCR gebunkert werden muss. Voraussetzung sind wie gesagt die pdfs mit OCR auf Commons. – Paulis 20:58, 13. Nov. 2013 (CET)
- SUUB bietet als PDF die einzelnen Artikel an, aber keine Quartalsbände. Wünschenswert währe aber sicher wenigstens die Quartals/Einzelbände (wollte man die zu ganzen Jahrgängen zusammen binden würden sie sicher zu groß werden) beisammen zu haben. Hat sich denn SUUB einmal geäußert, wie sie zur Spiegelung bei Commons stehen? Für die Arbeit mit PRS2 ist's ja sicher eine Voraussetzung. Viele Grüße --Konrad Stein (Diskussion) 11:57, 14. Nov. 2013 (CET)
- Hallo alle, ich gebe die Frage an Manfred Nölte von der SuUB weiter. Kontakt siehe oben. Die Quartalsbände, PDF mit hinterlegtem OCR-Text, dürften recht groß werden. Beispielrechnung: 130 Artikel in einem Quartalsband, mal ca. 2,5 MB je Artikel-PDF = 325 MB. Wäre also die Frage, wie SuUB das an WS übermittelt oder ob SuUB das selbst auf Commons hochladen kann. Ich werde fragen. Viele Grüße --Lit cht (Diskussion) 18:23, 15. Nov. 2013 (CET)
- Die SuUB Bremen wird in kürze zunächst drei bandweise PDFs auf Commons zur Verfügung stellen. Der erste Band (Jahrgang 1841) hat 107MB, die weiteren Bände sind sicherlich größer. --134.102.196.207 15:00, 27. Nov. 2013 (CET)
- Servus, wen n sich das noch beeinflussen lässt, würde ich mich freuen, wenn einer dieser drei Bände 52. Jg., 1893, Bd. 1 wäre --morray (Diskussion) 21:18, 10. Feb. 2014 (CET)
Vorarbeit für Vorlage
[Bearbeiten]Wenn sich jemand an die Gestaltung der Vorlage:GrenzbotenArtikel (Kopie von Vorlage:GartenlaubenArtikel?) machen will, hätte ich hier eine zusammengestückelte Abfolge von Verlagen und Orten und eine unvollständige der Herausgeber mit Überlappungen, teilweise von hier, hier, teilweise aus Jubiläumsbeiträgen. --Maasikaru (Diskussion) 19:05, 4. Jan. 2014 (CET)
Verlage
[Bearbeiten]- 1841-1842, 1. Sem. Brüssel : Deutsches Verlags-Comptoir
- 1842, 2. Sem. -1885, Bd.1, H.1 Leipzig : Fr. Ludwig Herwig (Fr. Wilhelm Grunow)
- 1885, Bd.1, H.2.-1909 Leipzig : Fr. Wilhelm Grunow
- 1910-1919, Bd.4, H.49 Berlin : Grenzboten
- 1919, Bd.4, H.50-1922, H.13 Leipzig, Berlin : K. F. Koehler
- 1922, H.14-48/55 Berlin : Deutscher Verlg
Herausgeber
[Bearbeiten]- 1841-1848 Ignaz Kuranda
- 1848,Bd.3 Redaktionsleitung: Gustav Freytag, Julian Schmidt
- 1851,22-1860,26 Gustav Freytag, Julian Schmidt
- 1867,25-1870 Gustav Freytag
- 1898, Bd.1, H.7 - 1906, Bd.1 Johannes Grunow
- 1908, Bd.4, H.12-1909 Karl Weisser
- 1909, Bd.3 - 1919 George Cleinow
- 1910-1912 Paul Mahn
- 1909-1920 George Cleinow
- 1920-1922 Fritz Kern
Weiteres Vorgehen
[Bearbeiten]Um die Sache voranzutreiben, habe ich unserer Verbindungsperson zur SUUB Mitteilungen gesendet (Benutzer_Diskussion:Manfred_Nölte#Weiteres_Vorgehen). Ich hoffe, das war hilfreich. Viele Grüße von Euerem --Konrad Stein (Diskussion) 21:10, 16. Nov. 2013 (CET)
- Ich habe ganz viele Fragen. Gerne würde ich diese telefonisch besprechen (siehe Kontaktdaten auf meiner Benutzerseite). Wann wäre das möglich? --Manfred Nölte (Diskussion) 15:41, 27. Nov. 2013 (CET)
- Möchte jemand die "Verhandlungen" führen, ansonsten übernehme ich das. Frühstens ginge das bei mir ab nächster Woche. – Paulis 19:01, 27. Nov. 2013 (CET)
- Liebe Paulis, gerne lasse ich Dir den Vortritt. Viele Grüße --Konrad Stein (Diskussion) 20:27, 27. Nov. 2013 (CET)
Stichpunkte unseres Gespräches:
- wir nehmen uns erstmal Band 1 vor; wenn die 110 MB auf Commons geladen sind (seit 3 Tagen ist das nicht möglich), dann lege ich den Index an; im Anschluß kann an den ER gefeilt werden
- als Projektansprechpartner sollte sich Einer von uns den Hut aufsetzen
- klar ist, dass die Grenzboten unvollständig geplant sind, d.h. wir sollten vll überlegen, welche Bände wir haben wollen; insgesamt sind das 81 Jahrgänge mit 187.000 Seiten, eine ganze Menge (zum Vergleich: de-Ws hat im Moment knapp 213.000 Seiten)
- Ob unsere Korrekturergebnisse direkt wieder ins Projekt der Bremer zurückgehen, kann nicht garantiert werden
- bei 98,x % OCR-Genauigkeit sind pro Seite doch noch reichlich Fehler, d.h. Texte können nur als unkorrigiert eingestellt werden
- für die Artikel soll eine Kopiervorlage erstellt werden
- Manfred Nölte wird uns noch eine kleine Einleitung zum Projekt verfassen und die xml-Datei erklären
– Paulis 21:07, 6. Dez. 2013 (CET)
- Sehr gut. Ich freue mich. Alles, was Musik betrifft bin ich sowieso dabei, aber so mancherlei auch aus Literatur und Philosophie. Ab einer bestimmten Zeit (ich kann es nicht genau beziffern) schwappen Die Grenzboten zu geharnischtem Nationalismus – das lässt mich dann schockgekühlt kalt. Doch alles andere ist alles andere… Dies nur als Meinung. --Konrad Stein (Diskussion) 21:43, 6. Dez. 2013 (CET)
- Nicht das sich der Verdacht aufdrängt, es würde nix passiern (was ja eigentlich sogar stimmt), es gibt immernoch ein technisches Problem auf Commons. – Paulis 21:16, 10. Dez. 2013 (CET)
- Hallo Paulis, ist das Problem behoben? Falls wir was dazu tun können, meld dich bitte im neuen Jahr beim DTA und/oder bei Manfred Nölte. Bis dahin: Schöne Feiertage! --Newdta (Diskussion) 11:32, 23. Dez. 2013 (CET)
- Lang hats gedauert, der vermeintliche Grund ist auf Commons nachzulesen. Hier nun Band 1: Index:Die Grenzboten 1-1841.pdf. Wünsche auch schöne Feiertage! – Paulis 21:26, 23. Dez. 2013 (CET)
- Das nenne ich doch mal: eine aufreibende Tätigkeit. Ich grüße die Pioniere. Und wünsche eine ruhige Zeit. Bis bald, alle zusammen, Euer --Konrad Stein (Diskussion) 23:37, 23. Dez. 2013 (CET)
- Die OCR ist gutes Zeug, da kann man nicht meckern. --A. Wagner (Diskussion) 23:53, 23. Dez. 2013 (CET)
- so gut, dass man den Text, wenn man ihn korrigiert vor dem Abspeichern, auch das Prädikat korrigiert verleihen kann. Siehe hier: Hilfe:Bearbeitungsstand#Alternative Vorgehensweise bei OCR-Texten Grüße --A. Wagner (Diskussion) 21:12, 20. Jan. 2014 (CET)
- kann oder soll? Reicht bei den doch zahlreichen und leicht überlesbaren e-c-Defekten wirklich eine zweite Durchsicht? mir rutschen da bei der Erstkorrektur regelmässig welche durch. --Maasikaru (Diskussion) 09:48, 21. Jan. 2014 (CET)
- Nun ja, das mag schon sein, aber auch bei fertigen Texten finden sich oftmals noch Fehler. Vielleicht hilft bei der Entscheidung ein Vergleich Mitarbeiterzahl mit Projektgröße. Sicher kann man aber auch nach dem Abschluss der Diskussion und dem weiteren Fortgang des Projekts den Bearbeitungsstand den WS-Regeln entsprechend anpassen. Viele Grüße --A. Wagner (Diskussion) 18:21, 21. Jan. 2014 (CET)
- kann oder soll? Reicht bei den doch zahlreichen und leicht überlesbaren e-c-Defekten wirklich eine zweite Durchsicht? mir rutschen da bei der Erstkorrektur regelmässig welche durch. --Maasikaru (Diskussion) 09:48, 21. Jan. 2014 (CET)
- so gut, dass man den Text, wenn man ihn korrigiert vor dem Abspeichern, auch das Prädikat korrigiert verleihen kann. Siehe hier: Hilfe:Bearbeitungsstand#Alternative Vorgehensweise bei OCR-Texten Grüße --A. Wagner (Diskussion) 21:12, 20. Jan. 2014 (CET)
- Die OCR ist gutes Zeug, da kann man nicht meckern. --A. Wagner (Diskussion) 23:53, 23. Dez. 2013 (CET)
- Hallo Paulis, ist das Problem behoben? Falls wir was dazu tun können, meld dich bitte im neuen Jahr beim DTA und/oder bei Manfred Nölte. Bis dahin: Schöne Feiertage! --Newdta (Diskussion) 11:32, 23. Dez. 2013 (CET)
- Nicht das sich der Verdacht aufdrängt, es würde nix passiern (was ja eigentlich sogar stimmt), es gibt immernoch ein technisches Problem auf Commons. – Paulis 21:16, 10. Dez. 2013 (CET)
Aktueller Stand und weiteres Vorgehen
[Bearbeiten]Zunächst einmal möchte ich mich (--Manfred Nölte (Diskussion) 16:04, 9. Okt. 2014 (CEST)) stellvertretend für die SuUB herzlich für die bereits getane Arbeit bedanken. Die korrigierten Texte konnten wir bereits im Rahmen unserer Projektarbeit verwenden. Korrekturen von Euch und dem DTA (Deutsches Textarchiv, BBAW Berlin) sind in die Erstellung von 204 Seiten Ground Truth Korpus eingegangen. Im weiteren werden wir diesen für die Parameteroptimierung unserer automatischen OCR-Nachkorrekturen verwenden. Unsere Kooperation war und ist nach wie vor eine gute Gelegenheit für mich die WikiSource kennenzulernen. Ich habe viel gelernt und so manche Idee für weitere Kooperationsmöglichkeiten.
Zeilengenaues Transkribieren
[Bearbeiten]Sorry, ich bin da vielleicht ein wenig naiv....aber kann mir mal jemand erklären, warum bei Fließtexten "zeilengenau" transkribiert werden muss? --Starshollow (Diskussion) 10:40, 4. Jan. 2014 (CET)
- Ich glaube: weil es die Übersicht erhöht. Man kann sich beim Korrekturlesen an den Zeilenanfängen, die bei Vorlage und Transkription dann ja gleich sind, leichter orientieren. --Konrad Stein (Diskussion) 16:44, 4. Jan. 2014 (CET)
- Die Übersicht auf der Seite leidet bei kleinen Bildschirmen (Laptop) wegen des notwendigen Querformat aber merklich. Ist das eventuell eine Erfordernis für eine (Bremer?) Nachnutzung?. Und: Gilt das jetzt?: Die bisher bearbeiteten Seiten inklusive der fertigen September-Scenen sind bisher nicht zeilengenau. --Maasikaru (Diskussion) 15:21, 6. Jan. 2014 (CET)
- Nein, das hat mit Nachnutzungsbedingungen nix zu tun. Ich selbst arbeite auch mit Laptop, die Editionsfenster nebeneinander, da geht das ganz gut, aber dass das letztlich eine Stilfrage ist, zeigt sich ja schon daran, dass verschiedene Leute das verschieden handhaben. In meinen Augen hat diese Richtlinie Empfehlungscharakter: weil es im Endergebnis egal ist, weil das Korrekturlesen dem einen leichter fällt (und man ja auch nicht überflüssigerweise Zeilenumbrüche beseitigen muss), dem anderen eben aber nicht. Mag jeder halten, wie es ihm bequemt. Ist jedenfalls meine Meinung. --Konrad Stein (Diskussion) 20:35, 6. Jan. 2014 (CET)
- eben, die beiden Fenster nebeneinander ist auf dem Laptop komfortabler. Dann lege ich auch mal los; wenn jemand "schimpft", kann man ja immer noch nachbessern. Was ich zeilengenau vorfinde, lasse ich aber so. --Maasikaru (Diskussion) 20:58, 6. Jan. 2014 (CET)
- Liebe WSler, ein Wort der potentiellen Nachnutzer aus dem DTA zum Thema zeilengenauer Transkription: Wir würden zeilengenau (mit Silbentrennung) in jedem Fall präfererieren, wie es auch Joergens.mi im Anschluss an das WS-Treffen in Leipzig angeregt hatte. Vor allem, weil es die Korrektur erleichtert. Wenn ihr euch dagegen entscheidet (und das auch in den ER so dokumentiert), sollte es auf jeden Fall einheitlich sein, also nicht nach Belieben mal so und mal anders. Ein weiterer Grund, der euch evtl. zum zeilengenauen Transkribieren bringen könnte: Die mit automatischen Methoden korrigierten Texte, die ihr nach Abschluss des Grenzboten-Projekts bekommen werdet, sind zeilengenau (kommen so aus der OCR und werden von uns auch so gehalten). Es wäre also dann in jedem Fall uneinheitlich zwischen den WS-eigenen Transkriptionen und denen aus dem Grenzboten-Projekt, die ihr in WS übernehmen könntet. Übrigens gibt es schon drei manuell korrigierte Artikel im DTA, die ihr gern übernehmen könnt: 1) [1], 2) [2] und 3) [3] --
2) und 3) werden morgen freigeschaltet und dann ohne Passwort zugänglich sein.Jetzt alle ohne Passwort zugänglich. So weit erst einmal, viele Grüße --Newdta (Diskussion) 15:14, 9. Jan. 2014 (CET)
- Liebe WSler, ein Wort der potentiellen Nachnutzer aus dem DTA zum Thema zeilengenauer Transkription: Wir würden zeilengenau (mit Silbentrennung) in jedem Fall präfererieren, wie es auch Joergens.mi im Anschluss an das WS-Treffen in Leipzig angeregt hatte. Vor allem, weil es die Korrektur erleichtert. Wenn ihr euch dagegen entscheidet (und das auch in den ER so dokumentiert), sollte es auf jeden Fall einheitlich sein, also nicht nach Belieben mal so und mal anders. Ein weiterer Grund, der euch evtl. zum zeilengenauen Transkribieren bringen könnte: Die mit automatischen Methoden korrigierten Texte, die ihr nach Abschluss des Grenzboten-Projekts bekommen werdet, sind zeilengenau (kommen so aus der OCR und werden von uns auch so gehalten). Es wäre also dann in jedem Fall uneinheitlich zwischen den WS-eigenen Transkriptionen und denen aus dem Grenzboten-Projekt, die ihr in WS übernehmen könntet. Übrigens gibt es schon drei manuell korrigierte Artikel im DTA, die ihr gern übernehmen könnt: 1) [1], 2) [2] und 3) [3] --
- Danke, Newdta; für die Informationen,
- ich befürworte unterdessen auch zeilengenaue Transkriptionen. Früher waren mir die „falschen“ Zeilenumbrüche ein Dorn im Auge, ich hatte sie – auch aus einem Bedürfnis des Purismus heraus – beseitigt. Unterdessen habe ich die Vorteile schätzen gelernt. Was es bei WS aber sicher nicht geben wird, ist ‚silbengenaue Trennung‘ (das nannte man mal „diplomatische“ Edition, oder?), denn es widerspricht basalen WS-Grundsätzen. Denn wenn Suchmaschinen (oder Textprogramme) ganze Worte suchen, sollen sie auch ganze Worte finden (samt anschließenden Satzzeichen und sogar beigefügten Fußnoten). Insofern editiert WS pragmatisch und nicht zeichendogmatisch. Diese – wie ich finde: kluge – Weichenstellung hat vor langer Zeit stattgefunden und wahrscheinlich alle Projekte setzen auf dieser Regelung auf. Viele Grüße von --Konrad Stein (Diskussion) 01:49, 10. Jan. 2014 (CET)
- Sehr schön, also zeilengenau. Habe ich beim Korrekturlesen so gemacht, dass ich am Zeilenende Enter gedrückt bzw. den Umbruch (ohne Leerzeichen) belassen habe, wie er war. Oder heißt das dann, dass man immer ein <br/> setzen muss? Aus einem „harten“ Enter wird offenbar in HTML ein Leerzeichen, so dass die Artikel dann doch wieder ohne Zeilenumbrüche erscheinen. Oder gibt es in WS eine Art impliziten Zeilenumbruch, der nur bei Bedarf erscheint bzw. dann für die Weiterverarbeitung in ein lb-Tag umgewandelt werden kann?
Silbentrennungen am Zeilenende werden aufgelöst. Getrenntes Wort bleibt dann auf der Zeile, auf der es beginnt, ja? (sollte dann auch in die ER) --Lit cht (Diskussion) 11:41, 10. Jan. 2014 (CET)
- Sehr schön, also zeilengenau. Habe ich beim Korrekturlesen so gemacht, dass ich am Zeilenende Enter gedrückt bzw. den Umbruch (ohne Leerzeichen) belassen habe, wie er war. Oder heißt das dann, dass man immer ein <br/> setzen muss? Aus einem „harten“ Enter wird offenbar in HTML ein Leerzeichen, so dass die Artikel dann doch wieder ohne Zeilenumbrüche erscheinen. Oder gibt es in WS eine Art impliziten Zeilenumbruch, der nur bei Bedarf erscheint bzw. dann für die Weiterverarbeitung in ein lb-Tag umgewandelt werden kann?
- Also, ich sag mal dazu, was ich kann. Ja, Enter; nein, kein „br“; „impliziten Zeilenumbruch“ verstehe ich nicht, weil ich „lb-Tagg“ nicht kenne; Silbentrennungen werden aufgelöst, Getrenntes Wort bleibt auf der Zeile (incl anschließendes Satzzeichen, incl wort- oder phrasenzugehörende Fußnote). Du hast recht, gehört in die EditionsRichtlinien (ER), sind aber Bestandteil der allgemeinen WS-ER (sollten wir aber dennoch benennen). Was ist „lb-Tagg“? Grüße von --Konrad Stein (Diskussion) 23:15, 10. Jan. 2014 (CET)
- das da?--Maasikaru (Diskussion) 11:21, 11. Jan. 2014 (CET)
- Ja, das meinte ich, sorry, wenn ich da was durcheinander gebracht habe- Jedenfalls schien es mir, dass wenn ich nur Enter drücke, es keinen Unterschied macht, weil es am Ende im HTML sowie in ein Leerzeichen ohne Unterschied zu den anderen Leerzeichen umgewandelt wird. Wenn das so ist, dann können wir uns das zeilengenaue Transkribieren auch sparen. Wenn ich aber einen Tag setze, der einen Zeilenumbruch/line break ausdrücklich als solchen kodiert, egal, ob <br/> oder <lb/>, dann verschwindet der nicht im HTML. Mit „implizit“ meinte ich: Du setzt den Tag im Bearbeiten-Modus, aber der Zeilenumbruch muss in der HTML-Ansicht nicht angezeigt werden, ist aber für andere Anwendungsfalle nachvollziehbar gespeichert. --Lit cht (Diskussion) 01:58, 12. Jan. 2014 (CET)
- das da?--Maasikaru (Diskussion) 11:21, 11. Jan. 2014 (CET)
- eben, die beiden Fenster nebeneinander ist auf dem Laptop komfortabler. Dann lege ich auch mal los; wenn jemand "schimpft", kann man ja immer noch nachbessern. Was ich zeilengenau vorfinde, lasse ich aber so. --Maasikaru (Diskussion) 20:58, 6. Jan. 2014 (CET)
Formatierungsproblem
[Bearbeiten]Vielleicht sitze ich auch nur auf der Leitung: Ich habe beim zeilenübergreifenden Textauszeichnen ein Problem. Beispiel: 1.1841, PDF-Seite 202, Mitte. --Maasikaru (Diskussion) 12:11, 12. Jan. 2014 (CET)
- selbes Problem hier: 1.1841, PDF-Seite 74, im Untertitel/Inhaltsübersicht zum Artikel „[...] Moriz Schlesinger. Brockhaus [...]“ --Lit cht (Diskussion) 11:20, 13. Jan. 2014 (CET)
Hier zeigt sich ein Nachteil der zeilengenauen Transkribtion: Formatierungszeichen sind nur bis Zeilenende gültig. Müssen also am nächsten Zeilenanfang neu gesetzt werden. (Am ersten Beispiel bereits durchgeführt) --Konrad Stein (Diskussion) 13:58, 13. Jan. 2014 (CET)
Satellitenartikel
[Bearbeiten]Nächste Frage: Tagebuch 1841 1 enthält, wie sicher andere auch, neben dem Hauptartikel kleinere betitelte Satellitenartikel, vergleichbar den "Blättern und Blüthen" der Gartenlaube, deren separate Erfassung und Erschliessung nach meinem Dafürhalten durchaus Sinn machen würde. Könnenwollendürfen wir? --Maasikaru (Diskussion) 17:47, 6. Jan. 2014 (CET)--
- Könnte man ja auf der Projektseite als Unterpunkte auflisten. Für jeden Eintrag ins Tagebuch eine eigene Seite zu erstellen, würde vielleicht doch zu kleingliedrig werden. Grüße von --Konrad Stein (Diskussion) 20:35, 6. Jan. 2014 (CET)
- ich fände die Möglichkeit von Querverlinkungen nach und vor allem _von_ aussen spannend. Beispiel: w:Johann Heinrich von Geymüller der Jüngere wird im vorgenannten Tagebuch behandelt. Könnte von WP nach WS auch als Unterpunkt verlinkt werden, von WS nach WP nur über einen eigenen Artikel, da WP-Textlinks unerwüscht sind. --Maasikaru (Diskussion) 20:58, 6. Jan. 2014 (CET)
- Hier mal ein Beispiel für den Tagebuch-Inhalt: Die Grenzboten (1841/1842). Bin mir aber nicht sicher, ob es sinnvoll ist wirklich jeden Vierzeiler aufzuführen. Was die Verlinkungen betrifft: das ließe sich gegebenenfalls noch per WS-Anmerkung machen, allerdings sollte das dann systematisch geschehen und nicht nur sporatisch passieren (denn dafür gelten die Grundsätze von Wikisource:Kommentieren), was aber kaum zu leisten sein dürfte. Grüße --Konrad Stein (Diskussion) 19:18, 7. Jan. 2014 (CET)
- ich finde die Blätter und Blüthen-Artikel gar nicht so schlecht, würde aber gerne noch mehr Meinungen abwarten. Da WP das Massenprodukt ist, wäre der Link von aussen, auch als PR-Massnahme fast der sinnvollere. Die Bedenken bezügl. fallweiser Verlinkungen verstehe ich; ich kann mein Mitteilungsbedürfnis notfalls auch via Diskseite ausleben :-> . --Maasikaru (Diskussion) 11:26, 11. Jan. 2014 (CET)
fett oder Kursiv?
[Bearbeiten]- An Textauszeichnungen wird gesperrt zu fett. [oder kursiv? fett scheint eher so deutlich wie gesperrt ins Auge zu springen] --Konrad Stein (Diskussion) 13:58, 13. Jan. 2014 (CET)
- Kommentar: kursiv wäre einheitlicher zu anderen WS-Projekten--Lit cht (Diskussion) 15:43, 9. Jan. 2014 (CET)
- Kommentar: fett wirkt mMn störend aufdringlicher als kursiv --Maasikaru (Diskussion) 12:05, 12. Jan. 2014 (CET)
- Kommentar: kursiv wäre mir lieber, da ähnlicher zu anderen Projekten und Fett schreit so. --Jörgens.Mi Talk 19:49, 13. Jan. 2014 (CET)
- 3:0 -- dann ist das beschlossen? Dann bitte oben ändern, Diskussion:Die_Grenzboten#Text da steht noch "An Textauszeichnungen wird gesperrt zu fett" --Lit cht (Diskussion) 09:18, 14. Jan. 2014 (CET)
- Nur für’s Protokoll: 3:1, denn ich würde fett bevorzugt haben. Habe aber auch keine Probleme mit Kursiv. Es sollten allerdings auch die bereits bestehenden Seiten nachgepflegt werden (wäre eine Anfrage an Bot-Besitzer wert). Grüße von --Konrad Stein (Diskussion) 20:09, 14. Jan. 2014 (CET)
Ge – danken — strich
[Bearbeiten]Bitte die Länge des Gedankenstriches festlegen, ich sah vorhin die Verwendung von Geviert- und Halbgevierten in einem Text. Meine Empfehlung wäre der Halbe (–), da der lange bei Blocksatz mitunter große Lücken reißt. – Paulis 21:10, 14. Jan. 2014 (CET)
- ich neige, ohne Feuer, zum Ganzen. Das kommt der Vorlage näher und steht so auch im OCR-Text. Kann mich aber anpassen. Nur bitte mal festlegen, oder später mal einen Bot vorbeischicken. Maasikaru (Diskussion) 10:13, 19. Jan. 2014 (CET)--
- Ich würde dagegen, um innerhalb WS einheitlich zu bleiben, den Halbgeviertstrich setzen. Siehe Wikisource:Editionsrichtlinien#Geviertstriche --Lit cht (Diskussion) 23:19, 19. Jan. 2014 (CET)
Gedichte
[Bearbeiten]<poem></poem> mit Zelennummerierung in Fünferschritten? --Maasikaru (Diskussion) 16:10, 21. Jan. 2014 (CET)