Wikisource:Skriptorium/Archiv/2023/September

aus Wikisource, der freien Quellensammlung
Archiv Diese Seite ist ein Archiv abgeschlossener Diskussionen. Ihr Inhalt sollte daher nicht mehr verändert werden. Benutze bitte die aktuelle Diskussionsseite.

Um einen Abschnitt dieser Seite zu verlinken, klicke im Inhaltsverzeichnis auf den Abschnitt und kopiere dann Seitenname und Abschnittsüberschrift aus der URL-Zeile deines Browsers (Beispiel: [[Wikisource:Skriptorium/Archiv/2023/September#Abschnittsüberschrift]]).

WS-Verlinkungen unerwünscht?

Ich hatte zwei Gartenlaubenartikel über Werder (Havel) in der dortigen Literaturliste eingefügt und diese Bearbeitung wurde mit dem Kommentar „ Änderung 237178653 von Jenne1504 rückgängig gemacht; keine Artikelverbesserung, grenzt an Literaturspam, bitte WP:NICHT beachten“ revertiert… Was ist das denn für ein Umgang, warum machen wir den ganzen Scheiß hier eigentlich, wenn nicht mal im Schwesterprojekt verlinkt werden darf. Sowas ist unfassbar demotivierend… —Jenne1504 (Diskussion) 21:57, 11. Sep. 2023 (CEST)[Beantworten]

Dazu hatten wir Anfang des Jahres schon einen kleinen Meinungsaustausch, vgl. #Interwiki - Wege gedeihlicher Zusammenarbeit mit Wikischwestern. --Dorades (Diskussion) 22:18, 11. Sep. 2023 (CEST)[Beantworten]
Warum du den ganzen Scheiß hier machst, kannst nur du selber wissen. --2003:C9:EF25:A600:618F:F2CB:8B4D:FEEE 07:29, 13. Sep. 2023 (CEST)[Beantworten]
Kein Kommentar. ELexikon (Diskussion) 12:07, 13. Sep. 2023 (CEST)[Beantworten]
Habe dies auf w:Benutzer Diskussion:Biberbaer angesprochen. ELexikon (Diskussion) 13:19, 13. Sep. 2023 (CEST)[Beantworten]
Na der Kollege dort ist ja schon ganz nah dran, wenn er meint, die Gartenlaube ist von 1938-1944 erschienen und das wären dann Erkenntnisse aus der DDR-Zeit... Manchmal weiß ich echt nicht mehr weiter. --Jenne1504 (Diskussion) 15:12, 13. Sep. 2023 (CEST)[Beantworten]
@ Jenne1504; gerade gelesen: Ironie an Artikel 1 GG wurde geändert: Die Dummheit der Menschen ist unantastbar. Ironie aus Gruß, --Peter-K (Diskussion) 19:10, 13. Sep. 2023 (CEST)[Beantworten]
Archivierung dieses Abschnittes wurde gewünscht von: Jenne1504 (Diskussion) 10:42, 14. Nov. 2023 (CET)[Beantworten]

Musiknoten

Falls irgendwer ne Meinung dazu hat, ob Transkriptionen von gemeinfreie Noten in der Wikisource OK sind, dann gerne unter Wikisource Diskussion:Was Wikisource nicht ist#Punkt 4 schreiben. Habitator terrae (Diskussion) 00:27, 17. Sep. 2023 (CEST)[Beantworten]

Archivierung dieses Abschnittes wurde gewünscht von: Mapmarks (Diskussion) 18:49, 19. Dez. 2023 (CET)[Beantworten]

Hinweis Google Chrome - Google Books Digitalisate nach US Copyright zugreifbar

Liebe Mitstreiter, ich habe einen Hinweis an alle, die häufig Google-Books-Digitalisate (nur die, nicht die Entsprechungen bei Hathitrust) nutzen. Seit ca. 6 Wochen, aber seit dem persistierend, kann ich bei Nutzung meines Google-Chrome-Browsers ohne Zuhilfenahme einer VPN-Erweiterung oder professionellen VPN-Anwendung Bände bis Erscheinungsjahr 1927 zugreifen, die z.B. bei Zugriff über Firefox oder Edge nicht zugänglich sind. Anders ausgedrückt, offensichtlich hat Google seinen Chrome-Browser so umprogrammiert, dass das konzerneigene Google-Books Nutzer von Chrome so behandelt, als griffen die Nutzer aus den USA auf Google Books zu, und ihnen somit ohne Umstände Digitalisate zugänglich macht, die nur nach US-Recht frei zugänglich sind (da dort Bände längstens 95 Jahre Copyright-Schutz genießen können). Das ändert jedoch nichts daran, dass noch immer 10.000e Digitalisate existieren, bei denen trotz Angabe eines Erscheinungsjahr etwas in den Copyright-Einstellungen nicht hinhaut, sodass die Bände weder über Chrome noch über VPN-Programm zugänglich sind, dann hilft nur eine Help/Support-Anfrage über das entsprechende Formular auszufüllen, dann werden die Bände meist problemlos geöffnet. Allerdings ist hierbei zu berücksichtigen, dass Google Books Support manchmal Theater macht, wenn man im Link die Länderkennzeichnung .de verwendet bei Bänden, die zwischen 1897 und 1927 erschienen sind. Obwohl sonst mit VPN-Erweiterung oder über Chrome entsprechend Bände egal welcher Provenienz bis 1927 zugänglich sind, sagt Google Books Help bei Nutzung der Länderkennzeichnung .de im Link zum Digitalisat, dass diese Bände nicht geöffnet werden könnten, da sie nach deutschem Copyright noch nicht frei zugänglich seien. Also bitte in der Linkadresse books.google.de durch books.google.com ersetzen. Haendelfan (Diskussion) 23:18, 10. Sep. 2023 (CEST)[Beantworten]

Archivierung dieses Abschnittes wurde gewünscht von: 9xl (Diskussion) 09:16, 5. Feb. 2024 (CET)[Beantworten]

Die ozeanographischen Arbeiten der Deutschen Antarktischen Expedition 1911-1912

Ist dieser Scan als Textgrundlage ausreichend? Jo-Jo Eumerus (Diskussion) 09:38, 22. Sep. 2023 (CEST)[Beantworten]

Für den größten Teil sicherlich. Leider sind sämtliche Karten im Anhang des Buches nicht vernünftig gescannt worden. Da wäre es sicherlich schön, eine Ausgabe zu haben, in der die Karten ausgeklappt wurden vorm Scannen. Und man muss bedenken, dass es ein Werk mit sehr vielen Tabellen und einigem an mathematischen Formeln ist, das ist vom Aufwand her nicht zu unterschätzen. --Jenne1504 (Diskussion) 10:17, 22. Sep. 2023 (CEST)[Beantworten]
@Jo-Jo Eumerus: In der Digitalen Bibliothek des BSH (die angeblich "für die Öffentlichkeit noch nicht zugänglich [ist]", hab aber extra nachgefragt, ob es OK ist, wenn ich sie hier jetzt schon verlinke) findet sich ein deutlich besserer Scan. Habitator terrae (Diskussion) 21:23, 25. Okt. 2023 (CEST)[Beantworten]
Unabhängig von einem besseren Scan muss das Projekt dennoch vorgestellt werden und benötigt ausreichend Mitstreiter. --Jenne1504 (Diskussion) 10:23, 26. Okt. 2023 (CEST)[Beantworten]
Archivierung dieses Abschnittes wurde gewünscht von: 9xl (Diskussion) 10:29, 4. Apr. 2024 (CEST)[Beantworten]

Neue Werkzeuge für OCR im Testbetrieb

Eine weitere Testversion von Wikimedia-OCR läuft seit heute hier: https://kraken-ocr.wmcloud.org/. Neue Features:

  • Zusätzliche Modelle Latin, Fraktur und ein Frakturmodell der UB Mannheim für Tesseract OCR
  • Neu: Kraken OCR, Open Source, Modelle für Druck- und Handschriften. Hinweis: langsamer als Tesseract, also bitte Geduld mitbringen
  • Neu: Option zum Normalisieren des OCR-Textes (ersetzt einige historische Zeichen wie beispielsweise das lange S in moderne Schreibweise)
  • Code und Betriebsystem sind aktuell

Siehe auch https://github.com/wikimedia/wikimedia-ocr/pull/89. Stefan Weil (Diskussion) 18:47, 22. Sep. 2023 (CEST)[Beantworten]

@Stefan Weil: Danke für die Mitteilung dieser Neuigkeiten. --Mapmarks (Diskussion) 23:35, 22. Sep. 2023 (CEST)[Beantworten]
Gerne. Ich bin auch für Rückmeldungen und Änderungsvorschläge dankbar. Stefan Weil (Diskussion) 23:43, 22. Sep. 2023 (CEST)[Beantworten]
Archivierung dieses Abschnittes wurde gewünscht von: 9xl (Diskussion) 10:30, 4. Apr. 2024 (CEST)[Beantworten]

Der Ackermann aus Böhmen und andere Problemkinder

Nach längerer Pause, die ich vorzugsweise einem Waisen aus der Kategorie Wikisource:Verwaistenliste zugewandt hatte, habe ich jetzt obiges Thema wieder angerührt. Von ursprünglich weit über 20 Waisen konnte den meisten geholfen werden, einigen, darunter dem Ackermann, konnte bisher nicht geholfen werden, weil wir keine kompetenten Pflegeeltern finden. Um beim Pflegling Ackermann zu bleiben, hat sich überschlägig seit vier Jahren überhaupt nichts mehr getan, und, ohne Experte in diesem Metier zu sein, zeigt mir ein grober Abgleich mit Gutenberg zum gleichen Thema manche Differenz, aus welchen Gründen auch immer. Lässt es unser Stolz zu, unser Projekt schlicht einzusargen zugunsten dem Projekt Gutenberg? Pfaerrich (Diskussion) 14:38, 18. Sep. 2023 (CEST)[Beantworten]

Grundsätzlich (gilt auch für die Drei Register Arithmetischer ahnfeng zur Practic): Wikisource ist gegenwärtig kein übliches Tool für Transkription von Handschriften. Ohne da besonders viel zu wissen, scheint mir, dass Werkzeuge wie Transkribus mehr auf diese Aufgabe zugeschnitten sind. Obendrein ist Wikitext kein Datenformat, das in textbezogenen Digital Humanities für Primärtexte verbreitet wäre. Da wird eher TEI-P5-konformes XML als Standard gehandelt. Zumindest für mich ist das eine innere Hemmschwelle: Warum sollte ich hier meine Zeit investieren, wenn das Ergebnis nachher nicht den Ansprüchen der Fachcommunity genügt? (Mal ganz davon ab, dass ich mehr als genug Hobbies habe. ;)) --Jonas kork (Diskussion) 15:10, 18. Sep. 2023 (CEST)[Beantworten]
Du hast grundsätzlich recht; leider sehe ich aber nicht, wie es allein technisch möglich sein sollte (bzw. wer das in der vorhandenen Struktur machen sollte), TEI-P5-XML als Arbeitsformat einzuführen. Mit unserem bisherigen Kurs, zuverlässige Texte historischer Quellen zu erstellen, fahren wir aber gar nicht so schlecht (wie z. B. die Übernahme einiger Texte ins Deutsche Textarchiv oder die laufende Kooperation mit der SLUB zeigen).
Davon mal abgesehen ist Transkribus, soweit ich informiert bin, aber ein Tool zur automatischen Transkription verschiedenster Schriftarten bzw. zum Training solcher automatischen Transkriptionen. Der dort erzeugte Text eignet sich dann zur Weiterverarbeitung in verschiedensten Umgebungen und wurde hier auch schon genutzt. --Dorades (Diskussion) 20:28, 18. Sep. 2023 (CEST)[Beantworten]
Mit der "vorhandenen Struktur" bin ich überhaupt nicht glücklich und diese hält mich mittlerweile komplett von der Korrekturarbeit ab. Selbstverständlich sollte es das Ziel sein, TEI als das maßgebliche Aufbewahrungsformat zu verwenden. Das kann man unterschiedlich umsetzen: es ist nicht zwingend erforderlich, dass die Korrektoren direkt mit TEI-Tagging arbeiten.
Dinge, die mich sehr stören: 1) Zeilenumbruch wird nicht beachtet (folglich ist es unnötig anstrengend, Original und Transkription parallel zu lesen); 2) Seitenumbruch geht in der Folge auch zumeist(?) unter. Bei den Distributed Proofreaders ist auch nicht alles optimal (TEI nicht als maßgebliches Aufbewahrungsformat), aber deren Interface kommt mir insgesamt sehr entgegen. --Keichwa (Diskussion) 07:23, 19. Sep. 2023 (CEST)[Beantworten]
Kurz zu 2): Seitenumbrüche werden in der Transkription umgesetzt, nur bei Worttrennung wird das Wort in der Regel auf der ersten Seite zusammengezogen. Wenn Punkt 1) für dich ein großes Manko darstellt, ließe sich das sicher im Skriptorium diskutieren, manch andere teilen da glaube ich deine Auffassung. --Dorades (Diskussion) 18:36, 21. Sep. 2023 (CEST)[Beantworten]
(Ich weiß nicht, ob es angängig ist, fremde Beiträge zu teilen; habe es gemacht, um direkt kurz antworten zu können.)
zu 2) Ich habe mich ungeschickt ausgedrückt. Ja, die Info "Seitenumbruch" geht nicht verloren. Aber ich hatte mal den Fall, dass während eine Korrektur- oder Kontrollphase, ich in einem längeren Text schon mit dem Gesamtwerk zu tun hatte und fand das umständlich. 1) werde ich gelegentlich hier separat thematisieren (gut, dass ich damit nicht allein dastehe). --Keichwa (Diskussion) 09:55, 22. Sep. 2023 (CEST)[Beantworten]
Ob nun unmittelbar in TEI gearbeitet wird oder es "nur" als Aufbewahrungsformat genutzt wird, ist in meiner Wahrnehmung der technischen Infrastruktur relativ egal. Vor allem bräuchte es jemanden, der/die das in der Wiki-Software technisch umsetzt. Ich wage zu behaupten, dass wir in de.ws jedenfalls niemanden mit entsprechenden Ambitionen/Zeit/Vorkenntnissen haben. Vielleicht sieht es da international besser aus, das kann ich nicht beurteilen, allerdings galt diese Sprachversion mit ihrer strikten Scanregel in der Vergangenheit eher als besonders streng, weshalb ich bezweifle, dass es da im Hinblick auf wissenschaftliche Standards andernorts größere Ambitionen gäbe. --Dorades (Diskussion) 18:36, 21. Sep. 2023 (CEST)[Beantworten]
Die schwierige Sprache und die Konzentration unserer Kräfte führen zum Schluss: Am besten "würdig einfrieren" (die schönen Bilder gfallen mir), mit einem Hinweis auf Gutenberg ergänzen und im Bearbeitungsstand irgendwie vermerken: Hier ist Schluss. ELexikon (Diskussion) 15:14, 18. Sep. 2023 (CEST)[Beantworten]
Was würde denn ein solches Einfrieren nutzen? Leuchtet mir nicht unmittelbar ein. --Dorades (Diskussion) 20:28, 18. Sep. 2023 (CEST)[Beantworten]
hallo Dorades, ob Einfrieren oder Einsargen, bliebe sich ziemlich gleich. Abgesehen von den Textdaten wird der gesamte Text samt Bildern in der Wiedergabe unterdrückt und die Gründe hierfür dargelegt sowie auf die parallele Existenz im Gutenberg-Projekt hingewiesen. Wer es sich dennoch zu Gemüte führen möchte, kann dies leicht bewerkstelligen oder das Projekt zu einem guten Ende führen. Aber die Verwaistenliste würde um einen Posten entsorgt. Dass Unbefugte das Werk wieder aufleben lassen, kann unterbunden werden. Pfaerrich (Diskussion) 23:24, 18. Sep. 2023 (CEST)[Beantworten]
Hallo Pfaerrich, ich finde das ehrlich gesagt keine so gute Idee. Zu einem Ende geführt werden kann das Projekt jetzt genau so leicht wie jedes andere und der Verweis auf Gutenberg-DE ist ebenfalls problemlos möglich. Mit einem Einfrieren würden wir ein meiner Meinung nach seltsames und nicht sonderlich sinnvolles Zwischendrin schaffen, in dem der Text bei WS da ist, aber nicht fertig ist und auch nicht bearbeitet werden kann. Warum nicht in diesem Zustand und damit korrigierbar lassen? Eine alternative Lösung des eigentlichen Anliegens wäre die Streichung des Texts von der Verwaistenliste und Übertragung auf Wikisource:Projekte, womit ich kurz zu einem generelleren Punkt kommen möchte (du verzeihst mir hoffentlich, dass ich allgemeiner werde):
Grundsätzlich finde ich die Auflistung von Projekten unter Wikisource:Verwaistenliste nicht so glücklich. Wir hatten zuvor schon "Altlasten" als solche ausgewiesen, nachdem ich (wohl nicht alleine) die Schließung der Seite erreicht hatte, entstand kurz darauf die Verwaistenliste. Für mich mutet das immer ein bisschen nach Pranger an (der jetzige Name ist aber definitiv besser gewählt) und die Sinnhaftigkeit erschließt sich mir hier auch nicht so ganz. Wenn es sich um regulär gestartete Projekte nach unseren Regeln handelt, können sie auf Wikisource:Projekte gelistet werden, wenn nicht, kann ein Löschantrag erfolgen. Dass wir in der Verwaistenliste auch Projekte haben, die vor der Existenz unserer Regeln gestartet wurden, ist mir klar, aber von solchen gibt es unter Projekte ja auch noch mehr. Zusammen mit Wikisource Diskussion:Projekte sollte das meiner Meinung nach ausreichen, um eine Buchführung nicht zu Ende gebrachter Projekte zu erlauben. Meine eher ablehnende Haltung der Seite gegenüber soll aber keinesfalls dein Engagement und das von anderen im Hinblick auf liegen gebliebene Texte klein reden; im Gegenteil gebührt dir und anderen großer Dank dafür, dass ihr euch solcher Texte annehmt. Nur ob es dazu diese spezielle Struktur braucht, frage ich mich. --Dorades (Diskussion) 18:36, 21. Sep. 2023 (CEST)[Beantworten]
Hallo Dorades, so diametral liegen unsere Ansichten nicht auseinander. Woran ich mich reibe, sind fahrlässig in die Welt gesetzte Ruinen, wo den Inititator schon kurze Zeit nach Beginn der Mut verlässt und er die Drecksarbeit komplett Anderen überlässt. Beispiele dafür sind zur Genüge bekannt. Immerhin konnten wir einen Großteil doch noch zu einem brauchbaren Ende führen, wenn es auch wertvolle Zeit von Aktiven beanspruchte, die von eigenen, ggf. interessanteren Projekten Abstand nahmen.
Einige der verbliebenen Ruinen sind der Reputation unserer Community nicht förderlich und gehören eher abgewickelt denn weiter verfolgt. Solches gilt für die Taufmatrikel oder die Arithmetischen ahnfeng, für die eine Vollendung zu unseren Lebzeiten nicht wahrscheinlich dünkt. Also als "klassische Ruine" benamsen oder einfrieren, aber weg aus dem Stigma einer dauerhaft verwahrlosten Baustelle. Pfaerrich (Diskussion) 11:44, 22. Sep. 2023 (CEST)[Beantworten]
Die Einstellung teile ich grundsätzlich nicht. Klar, ein Projekt sollte solide initialisiert sein (vollständige Metadaten, Scans und OCR nach bestem Wissen und Gewissen, brauchbare Projektbeschreibung einschl. Hinweise zur Korrektur). Ist das gegeben, kann man den Dingen ihren Lauf lassen; ob etwas zu unseren Lebenszeiten bei diesem Gemeinschaftsunternehmen fertig wird, ist für mich von nachrangiger Bedeutung.
Ich wähle gern aus vielen Projekten aus (vorausgesetzt das (Editier-)Umfeld nervt mich nicht zu sehr). Was mich bei einem Freiwilligen-Projekt nicht interessiert, mache ich einfach nicht. Ich akzeptiere natürlich, wenn andere andere Vorstellungen von der Sache haben. --Keichwa (Diskussion) 09:43, 28. Sep. 2023 (CEST)[Beantworten]
Ich würde hier gerne provokant fragen (ohne jemanden tatsächlich provozieren zu wollen): Haben wir es eilig? Müssen wir auf einen Zug? Ist demnächst Redaktionsschluß? Eine Handschrift ist sicher nicht jedermanns Sache. Wenn es länger dauert, dann dauert es halt länger. So what? Wenn sich jemand daran stört, daß Teile davon noch nicht zweimal korrigiert sind, soll er/sie es halt selbst korrigieren. It's a wiki. Bevor ich vor bald 18 Jahren zur Wikipedia kam, habe ich ein oder zwei Jahre bei den Distributed Proofreaders mitgemacht, die schon damals eine für Transkription von Texten bessere Software hatten. Vor Handschriften habe ich schon dort einen Riesenbogen gemacht.
Wir haben hier die MediaWiki, und was anderes werden wir nicht bekommen. Diese ist ursprünglich auf WP ausgelegt, aber es ist erstaunlich, wie spezifisch angepaßt diese inzwischen für einige Schwesterprojekte ist, gerade hier auf Wikisource und vor allem auf Wikidata. Alle anderen Projekte haben nur geringe Anpassungen; das Wiktionary verläßt sich vor allem auf Vorlagen, Wikinews auf vorgeladene Formatvorlagen, manche Projekte sind gar nicht angepaßt oder nur minimal (Wikiversity, Wikiquote).
Als ich vor drei Jahren oder so hier angefangen habe, hatte das zwei Gründe. Zum einen, weil in der FR:WP ein Benutzer in dieser Angelegenheit einen Editwar gegen mich führte, zum anderen wegen einer WP-Löschdiskussion, die mich indirekt zu Die Kunstdenkmäler des Grossherzogthums Baden. Band 6 führte. Seitdem transkribiere und korrigiere ich, bislang vor allem in dem Abschnitt zum Amt Ettenheim, was bis auf sechs Seiten kein Rotlink mehr ist. Warum? Weil ich einen Sinn darin sehe, diese Seiten in Wikipedia-Ortsartikeln zu verlinken, somit mehr Traffic hierher erzeuge und somit potentielle Mitarbeiter hierher locke. Und selbst wenn das nicht funktioniert, so erreiche ich doch immerhin, daß die Ortsartikel mit einem Mehrwert versehen werden, mit zusätzlichen Informationen zu Kulturdenkmälern, deren aktuelle Instanzen bekanntlich Staatsgeheimnis sind.
Was ich damit eigentlich sagen will: Unterschiedliche Wikisourcianer haben unterschiedliche Motivatione und vielleicht Ansprüche an dieses Projekt. Auch wenn ich oft (und vor allem auf WP) ungeduldig erscheine und es wohl auch bin, ist Eile eigentlich nicht Bestandteil meiner Arbeitsplatzbeschreibung im Wikimedia-Universum. Matthiasb (Diskussion) 19:30, 10. Okt. 2023 (CEST)[Beantworten]

Der Unterschied zu Gutenberg ist wohl schlicht darauf zurückzuführen, dass die eine Textgrundlage ("Textquelle") das Reclam 1963 und die andere eine Handschrift 15. Jahrhundert ist? Habitator terrae (Diskussion) 15:44, 19. Sep. 2023 (CEST)[Beantworten]

"Die Schwierigkeit der Textherstellung belegt augenfällig die Tatsache, dass seit 1917 nicht weniger als 9 selbständige kritische Ausgaben erschienen sind. Weder stemmatologische noch eklektische Versuche [...] noch das Leiths.-Verfahren haben bei der gegebenen Überlieferungslage trotz aller textkritischen Fortschritte zu einem allgemein akzeptierten Text geführt." (Gerhard Hahn: Johannes von Tepl, in: Die deutsche Literatur des Mittelalters. Verfasserlexikon. Band 4 (1983), Sp. 763-774, hier 766). --Jonas kork (Diskussion) 13:30, 26. Sep. 2023 (CEST)[Beantworten]
Archivierung dieses Abschnittes wurde gewünscht von: 9xl (Diskussion) 16:01, 17. Apr. 2024 (CEST)[Beantworten]