Wikisource:Skriptorium

aus Wikisource, der freien Quellensammlung
Wechseln zu: Navigation, Suche
Automatische Archivierung
Auf dieser Seite werden Abschnitte automatisch archiviert, die seit 1 Tagen mit dem Baustein {{Erledigt|~~~~}} versehen sind. Die Archivübersicht befindet sich unter Wikisource:Skriptorium/Archiv.
Kürzel: WS:SKR
Rayonnages Bibliotheque Mazarine Paris n2.jpg

Willkommen

Hier ist der richtige Ort für alle allgemeinen Fragen und Ankündigungen rund um Wikisource.

  • Fragen zu technischen Änderungen und Neuerungen werden in der Technikwerkstatt weiter diskutiert.
  • Unterstützung bei der Recherche zu Autoren und Texten erhältst Du in der Auskunft.
  • Inhaltliche Fragen zu vorhandenen Quellentexten oder einer anderen Seite stellst Du besser auf der jeweiligen Diskussionsseite.
  • Alternativ kannst Du auch in den IRC-Chat kommen.

Ältere Beiträge findest du im Archiv.


Inhaltsverzeichnis

Diskussionen im Skriptorium[Bearbeiten]

Major update of Proofread Page[Bearbeiten]

Auf der Wikisource-l mailing list kündigt Thomas Tanon folgendes an:

Hi everyone!

A major update of the ProofreadPage extension will be rolled out next Monday, The 25th November. Most of the code related to Page: pages, including the edition interface, have been rewritten by Aarti Dwivedi (User:Rtdwivedi) with my help as part of the Google Summer of Code 2013 project in order to have a cleaner and more maintainable code that will allow an easier fix of dozens of known bugs.

We have tried to keep the same user interface and to don’t break any features with the help of automated testing. The only big user interface change is that the links for previous, next and index pages are only displayed as icon on Vector skin (but remains as textual links on the other skins).

The HTML structure of view and edit modes of Page: pages have been changed, so some user scripts may be broken. OldWikisource scripts have been updated by User:Phe (many thanks to him) but some bugs may appear when the new code will be rolled out.

The new code is currently testable on test2.wikipedia.org. Here I’ve created two pages in order to hep testing: https://test2.wikipedia.org/s/9gi and https://test2.wikipedia.org/s/9i4 (notice that features added by OldWikisource scripts aren’t active there).

Thomas

Ich habs mal herkopiert, damit wir Montag wenigstens wissen, wieso schon wieder nix funktioniert. – Paulis 20:20, 23. Nov. 2013 (CET)


Thomas schreibt am 5. 12. in der Wikisource-l mailing:

Hi everyone!

I’m really sorry for all the issues affecting Wikisources. A fix for most of them have just been deployed (it have been an hard work) and I’ll try to fix all the remaining ones for the next Tuesday deployment.

Here is a list of the fixed issues:

  • The image didn’t appear for Page: pages that are member of a multipage file but that haven’t as Index: page a page called Index:NAME_OF_THE_DJVU (it have affected mostly pl.wikisource)
  • A part of some Page: pages body content appeared as part of their footer in edit mode when those pages contains a tag
  • The color of the link to a Page: page was red in the Index: page when its level category name contained a whitespace (to fix this issue a purge of each Page: page affected is required)
  • The creation of a Page: page using the API caused a fatal error
  • An indentation was displayed on the first paragraph of a Page: page

Here is the remaining known issues (thanks to report ones that haven’t been listed here):

  • The Page: pages edit summary contains twice the proofreading level change tag. A fix for it is on review that will let the software adds the tag on Page: page saving (the tag won’t be visible during the editing process.
  • The addition of default header and footer content adds a strange string instead of tags like . A fix for it is on review
  • The body textarea on Page: pages editing is too big. I’m working on a fix that would use the size defined in User preferences instead.
  • Fatal error on submit for a very few pages (a fix is on review)
  • It isn’t possible anymore to zoom in with a mouse. I’m working on a fix
  • the issue with gadget that Aubrey have reported here (I think that the solution is more on the gadget side that on the extension one)
  • It’s not possible to edit only the body of a page throw the API

I’m going to work on automatized tests in the next weeks in order to avoid a so major number of bugs the next times.

Sorry again,

Thomas

PS: For people that ignore it, the maintenance work of the ProofreadPage extension is mostly done by volunteers like you. So, please be kind

Paulis 10:53, 6. Dez. 2013 (CET)


Fehlerliste[Bearbeiten]

Ich wollte den Abschnitt Sonntag schon archivieren..... Nun gut. Wir sollten die Fehler mal auflisten. – Paulis 13:54, 4. Dez. 2013 (CET)

  • (Neuanlage) bei jeder Vorschau wird ein weiterer Bearbeitungsstand eingetragen (FF)
  • (Neuanlage) es werden keine Daten aus dem Index für Fuß- und Kopfzeile mehr gezogen (FF)
  • (Neuanlage) Zitierempfehlung fehlt (FF)
  • Bearbeitungsstand (Balken) geht nur bis zum Scan (FF)
  • Editierfenster ist riesengroß (FF)
    • Die Größe des Editfensters kann man selbst einstellen (am Anfasser rechts unten ziehen) --Rosenzweig (Diskussion) 23:05, 4. Dez. 2013 (CET)
Für FF ok, aber im IE sieht es bei mir übel aus. Dort ist kein Anfasser.--Wassermann (Diskussion) 22:26, 5. Dez. 2013 (CET)
  • Scan anklicken (Lupe) funktioniert auch nicht (FF)
  • Scan wird nicht mehr angezeigt (.djvu - Beispiel) - auch der Reiter "Scan" fehlt (nur bei djvu?)
    • Der Reiter "Scan" fehlt bei mehrseitiger Textgrundlage (djvu, pdf). Bei Einzelbildern ist er zwar vorhanden, liefert aber einen ungültigen Seitenaufruf. --Ostermaus (Diskussion) 13:02, 5. Dez. 2013 (CET)
  • Die Benutzereinstellung Seiten mit Bild Scan oben bearbeiten (unter Helferlein) funktioniert nicht mehr automatisch. Man muß jetzt immer manuell jede Seite umstellen.--Wassermann (Diskussion) 10:33, 6. Dez. 2013 (CET)
  • Ok  Scan wird angezeigt, läßt sich bewegen, aber nicht skalieren (Opera)
  • Bei jeder Vorschau oder Speichern wird ein Absatzumbruch am Ende eingefügt, ebenso in der Kopf- und Fußzeile (Opera)
  • Ok  In die Zusammenfassungszeile wird beim Setzen des BS nichts mehr automatisch eingetragen (Opera) --Mapmarks (Diskussion) 14:26, 8. Dez. 2013 (CET)
    • dito mit Firefox, hier fehlt wohl Javascript(?)-Code, der das früher erledigt hat --Rosenzweig (Diskussion) 21:33, 9. Dez. 2013 (CET)
  • Fügt man {{References}} ein, so wird der letzte Absatz auf der Seite nicht in die Paragraph-Tags <p></p> eingeschlossen (anonymous block box). Beispiel: http://de.wikisource.org/w/index.php?title=Seite:Annalen_der_Physik_und_Chemie_Bd_63_1844.pdf/159&oldid=2118948 --Mapmarks (Diskussion) 14:56, 8. Dez. 2013 (CET)
  • Manche Bearbeitungs-Buttons über dem Editfenster im Seiten-Namensraum (bspw. die, um den Scan zu vergrößern oder verkleinern) kommen nicht auf Anhieb bei Auswahl des Bearbeitungsmodus, sondern erst, wenn man zurückgeht und dann ein zweites Mal den Bearbeitungsmodus auswählt (FF). Die beiden genannten Buttons, vor allem den zweiten, brauche ich deswegen, weil sonst der Scan breiter als das Bearbeitungsfenster dargestellt wird. --Rosenzweig (Diskussion) 21:33, 9. Dez. 2013 (CET)

Nachdem nun fast acht Wochen vergangen sind: Tut sich noch was? Oder bleibt das jetzt so? Ich habe leider nicht den nötigen Einblick hinter die technischen Kulissen und weiß daher nicht, ob noch an der Behebung der Fehler gearbeitet wird. Darum frage ich nach und möchte jedenfalls an die obige Fehlerliste erinnern. Bei mir fehlen immer noch alle Buttons, ich weiß schon kaum mehr wie die aussehen. Die Einführung von Wikidata soll nun bevorstehen (siehe unten #Access to data in Wikidata: „unless any issues arise“) und diese geht womöglich auch nicht ohne Beeinträchtigung der Arbeit vor sich. Darum meine Bitte, wenn möglich erstmal die bereits bestehenden Bugs zu erledigen. --Mapmarks (Diskussion) 18:03, 27. Jan. 2014 (CET)

Hallo Mapmarks, bei mir sind die Buttons mittlerweile wieder da, zumindest in der Vektoransicht und die Einführung von Wikidata ist bereits vollzogen worden (zumindest die Interwikilinks) und verlief aus meiner Sicht eigentlich recht problemlos. Zwar sind noch keine Bots durch unsere Autoren gerauscht (wohl auch weil wir dafür keinen Namespace haben ;-) ), aber auch das sollte nicht weiter der Hit werden. --THE IT (Diskussion) 19:50, 27. Jan. 2014 (CET)

Nach wie vor nicht erledigt --Mapmarks (Diskussion) 17:46, 21. Feb. 2014 (CET)

Das ist leider nicht erledigt, wenigstens das Problem Seiten mit Bild Scan oben bearbeiten besteht noch immer. --9xl (Diskussion) 10:33, 22. Jan. 2015 (CET)

Begrüßungsbox auf der Hauptseite[Bearbeiten]

Hallo zusammen!

Ich hab es endlich mal geschafft und einen neuen Entwurf für die Begrüßungsbox auf der Hauptseite gebastelt. Die Box ist deutlich größer, enthält aber sämtliche Aktivitäten von WS und verlinkt analog zur Hauptseite der Wikipedia auf alle Themenfelder und WS-internen Seiten. Was haltet ihr davon? Habt ihr Ideen, wie die Hauptseite noch auf anderem Wege aufgehübscht werden könnte? Tschüß, --Koffeeinist (Diskussion) 12:40, 7. Jun. 2014 (CEST)

Gefällt mir insgesamt gut. Die linke Spalte wird bei mir länger angezeigt als die rechte. Wenn Jahrestage oder neue Übersichtsseiten in der rechten stünden, wären beide Spalten etwa gleich lang. Alternativ könnte man diese beiden Kästen nebeneinander unter Hilf mit setzen. Für Andere Sprachen würde ich auf dies verlinken. --Mapmarks (Diskussion) 16:54, 9. Jun. 2014 (CEST)
Deine Vorschläge hab ich umgesetzt. --Koffeeinist (Diskussion) 21:37, 11. Jun. 2014 (CEST)
Wenn niemand Einspruch erhebt, ändere ich in zwei Tagen die Begrüßungsbox. --Koffeeinist (Diskussion) 21:33, 29. Jun. 2014 (CEST)
Einspruch. Die Hauptseite ist eh schon überladen weil jeder sein Schätzchen da verlinkt sehen will. --9xl (Diskussion) 12:04, 1. Jul. 2014 (CEST)

(Aus der Diskussionsseite vom Hauptseitenentwurf hierher verlagert)

Straffen[Bearbeiten]

Ich finde die Hauptseite überladen und als Einstiegsseite ziemlich unbrauchbar. (Jedesmal wenn ich scrollen muss, halbiert sich mein Interesse.) Bei de.wp spicken wäre gar nicht schlecht, was Kompaktheit und Prägnanz betrifft. Im Einzelnen:

  • Willkommen-Box: Das meiste was da an Text steht gehört nach 'Über Wikisource' oder ist überflüssig. Straffen! Sehr gut finde ich die neue Themenleiste, jeder Link sollte auf eine Unterseite führen wo der Themenbereich dann ausgewalzt werden kann. Zeilenumbrüche in Links sollten verhindert werden. 'Wissenschaft und Technik' sollte man trennen, von Technik haben wir eh wenig, könnte auch entfallen. Geografie und Geschichte sind auch Wissenschaften.
  • Wikisource aktuell: Bildchen raus, bringt keinen Mehrwert. Max. 3 Punkte, aber keine Essays sondern kurz. Statistik nur Werke, alles andere könnte auf der Statistikseite oben angebracht werden.
  • Auswahl aus unserem Bestand: Ersatzlos raus, wird durch die Themenleiste oben überfüssig.
  • Jahrestage: gut wie es jetzt ist.
  • Kürzlich hinzugefügte …: In eine Box zusammenfassen. Abteilungen: Quellen max. 6, Themen und Orte max. 3, Autoren max. 3.
  • Hilf mit: Drastisch kürzen, auf eine oder zwei Unterseiten verweisen.

Die größte Herausforderung ist das einigermaßen aktuell zu halten - Ostern ist am Dienstag nach vorbei. --9xl (Diskussion) 18:57, 1. Jul. 2014 (CEST)

Erstmal Dankeschön für deine ausführliche Kritik, 9xl.
  • Die Willkommen-Box kann gerne gekürzt werden. Sie hat den größeren Umfang erhalten, weil manche Datenbanken, die auf uns verweisen, lediglich den Text der aktuellen Box übernommen haben. Wir haben aber mittlerweile weitere Aufgabenbereiche übernommen, die hab ich ergänzt. Das die Links mittelfristig auf Themenseiten führen sollten, sehe ich auch so. Für Geographie, Mythologie, Recht, Religion, Aberglaube und Handel gibt es schon Themenseiten, die anderen müssten erstellt werden. Bei der Wissenschaft im Sinne von science hast du völlig recht, das predige ich sonst auch immer und habs hier übersehen.
  • Wikisource aktuell: gerne.
  • Die Auswahl ist ja im Entwurf schon gestrichen.
  • Jahrestage: stimme ich auch zu.
  • Kürzlich hinzugefügt: Diese Boxen kann ich nicht verschmelzen, ohne die "echten" Boxen auf der Hauptseite zu beeinflussen, deshalb ist hier noch nichts passiert.
  • Hilf mit: gerne.

Wir sollten die Diskussion ins Skriptorium verlagern, dann können die anderen mitreden. Zusammenfassung: die Willkommensbox und Hilf-mit! kann ich kürzen, das Erstellen von Themenseiten braucht Zeit und mehr Schultern, die Zusammenfassung der kürzlich-hinzugefügt-Boxen technisches Verständnis. Tschüß, --Koffeeinist (Diskussion) 21:06, 1. Jul. 2014 (CEST)

Einer solchen Straffung würde ich zustimmen. Habe vor geraumer Zeit einmal darauf hingewiesen, dass unsere Hauptseite deutlich länger ausfällt als beispielsweise die der WP: Wikisource:Skriptorium/Archiv/2012/Mai#Hauptseite: WS vs. WP – damals fand meine Ansicht keine Zustimmung, jedoch auch keine breite Ablehnung. Vielleicht könnte man darüber eine Abstimmung einberufen. Man könnte zuvor testen, wie oft bestimmte auf der Hauptseite verlinkte Seiten abgerufen werden, um einen Anhaltspunkt zu gewinnen, welche Seiten oft aufgerufen werden: wikiviewstats. --Mapmarks (Diskussion) 21:24, 2. Jul. 2014 (CEST)
Willst du sämtliche verlinkten Seiten überprüfen - das sind ein paar Dutzend?

Wenn wir dem Vorschlag von 9xl (oben, erster Punkt) folgen, brauchen wir einige neue Themenseiten. Mittelfristig sollten wir diese übergeordneten Themenseiten sowieso anlegen, warum also nicht jetzt? Wir bräuchten folgendes:

  1. Geschichtswissenschaft ist in Arbeit --Koffeeinist (Diskussion) 21:18, 5. Jul. 2014 (CEST)
  2. Gesellschaft
  3. Literatur
  4. Politikwissenschaft
  5. Wirtschaftswissenschaften
  6. Naturwissenschaft
  7. Technik --Mapmarks

--Koffeeinist (Diskussion) 22:36, 2. Jul. 2014 (CEST)

Nein, nicht sämmtliche Dutzend. Ich dachte an die zur Debatte stehenden „Aus unserem Bestand“, bei denen würde ich nicht komplett streichen. Übrigens finde ich die bisherige Seite nicht unübersichtlich sondern nur etwas zuviel Information auf einmal.
Themenseiten bitte gerne! Man kann ja erstmal mit einer Struktur klein anfangen und später auffüllen. --Mapmarks (Diskussion) 23:03, 2. Jul. 2014 (CEST)
Alles klar, dann können wir das ja mal angehen. --Koffeeinist (Diskussion) 23:34, 2. Jul. 2014 (CEST)
In der Box „Aus unserem Bestand“ befinden sich derzeit ca. 80 Links. Was machen wir wenn die Aufrufzahlen kennen? --9xl (Diskussion) 18:21, 3. Jul. 2014 (CEST)
Wäre sehr für diese Themenseiten, denn hier [1], hier [2] und hier [3] wird unser Logo vermisst. Die Reihe könnte man fortsetzen. Was den Arbeitsaufwand angeht, schließe ich mich Benutzer Mapmarks an. Vielleicht kann sich ja jemand da etwas reinknieen. Grüße --A. Wagner (Diskussion) 21:47, 3. Jul. 2014 (CEST)

Habe es so gemeint, dass man die Zahlen zuhilfe nimmt, wenn man entscheiden wollte, welche Links man weglässt. Wenn die betreffenden Seiten nicht oft abgerufen werden, wäre es ein Hinweis dafür, dass auf ihre Links an so prominenter Stelle verzichtet werden kann. Dass die Seitenaufrufe allerdings nur wenig Information darüber enthalten, welche Inhalte „beliebt“ sind, ist mir klar. Ich habe trotzdem mal die Zahlen für die letzten 30 Tage abgefragt. Nur soviel: die zehn meistbesuchten Werke „aus unserem Bestand“ sind

  1. Paulys Realencyclopädie der classischen Altertumswissenschaft (2192)
  2. Faust - Der Tragödie erster Teil (1602)
  3. An die Freude (Schiller) (1297)
  4. Allgemeine Deutsche Biographie (1151)
  5. Kinder- und Hausmärchen (963)
  6. Die Gartenlaube (913)
  7. Reichsgesetzblatt (Deutschland) (686)
  8. Württembergische Oberamtsbeschreibungen (510)
  9. Göttliche Komödie (Streckfuß 1876) (439)
  10. Karawane (426)

Der am wenigsten besuchte Text hat nur 47 Treffer. Die Daten kann man bei wikiviewstats erhalten. Eine interessante Übersicht erhält man, wenn man im linken Menu auf „Insgesamt“ klickt und dann oben statt „heute“ den Juni auswählt. --Mapmarks (Diskussion) 20:53, 3. Jul. 2014 (CEST)

Wir können ja schauen, das diese beliebten Seiten noch drinbleiben. Ich werde mich demnächst um die Themenseiten Geschichte und Politik kümmern. Mal schauen, wie lange das dauert. --Koffeeinist (Diskussion) 09:33, 4. Jul. 2014 (CEST)

Hallo, eine übersichtliche Hauptseite findet man auch bei der englischen Wikisource. Was ich dort auch gut finde, ist die Rubrik Featured text of the month, den man als E-Book herunterladen kann.--Sinuhe20 (Diskussion) 10:35, 4. Jul. 2014 (CEST)

Ja, eine übersichtliche Einstiegsseite, besonders die Fußleiste "WIKIMEDIA FOUNDATION" finde ich fast genial. Aber auch dort zeigt sich der Trend zu langatmigen Ausführungen, damit das den Rahmen nicht sprengt wird dann die Schrift verkleinert. Davor sitze ich und nicke mehrmals um mit meinen Gleitsichtgläsern eine Zone zu finden, wo ich den Text noch erkennen kann - lesen möchte ich das nicht nennen. --9xl (Diskussion) 10:57, 5. Jul. 2014 (CEST)
Also ich finde unsere Hauptseite ehrlich gesagt gar nicht sooo schlecht, gerade für Neulinge. Willkommen bei Wikisource gibt schonmal eine Orientierung und einen guten Einstieg ins Projekt. Das Bild bei Wikisource aktuell lockert die Hauptseite etwas auf, die ansonsten fast nur eine Textwüste wäre. Den Rest finde ich auch ok, hat mich bisher eigentlich nicht großartig gestört. Auswahl aus unserem Bestand (max. 7 bis 10 Unterpunkte) und Kürzlich hinzugefügte Quellen (max. letzte 30 Tage) könnte man aber zugunsten von Übersichtlichkeit vielleicht wirklich etwas reduzieren.--Sinuhe20 (Diskussion) 11:45, 5. Jul. 2014 (CEST)
Schlecht findet sie wohl keiner, nur etwas unübersichtlich. Das ist wohl der Konsens.

Die Themenseite Geschichte ist jetzt in Arbeit. Wer mag weitere Themenseiten übernehmen? --Koffeeinist (Diskussion) 21:18, 5. Jul. 2014 (CEST)

Danke Koffeeinist für Deine Initiative. Habe mir Technik vorgenommen. Anmerkungen und Vorschläge erwünscht. --Mapmarks (Diskussion) 23:31, 8. Jul. 2014 (CEST)
Da entsteht ja nun eine Themenseite Technik. Über Technik haben wir ja nicht viel, aber bei anderen Themen sehe ich da wieder die Tendenz zur Uferlosigkeit. Als Einstiegsseite habe ich mir eher etwas nach dem Muster Thema vorgestellt, dürfte auch gern ein bisschen bunt sein.
Also die Seite(n) zu Geschichte sind folgendermaßen geplant: Es werden zwei, nämlich zur vorwissenschaftlichen Geschichtsschreibung und zur Geschichtswissenschaft. Beide listen ähnlich wie die Seite Kunst oder die Frauen die betreffenden Autoren auf und nennen die hier vorhandenen Hauptwerke sowie die vorhandenen Themenseiten. Die Seite zur Geschichtswissenschaft dient quasi als "Tutorienheft", listet also die unerlässliche Literatur (Lexika, Handbücher, Quellensammlungen) für die tägliche Arbeit auf. Wo möglich, verweist sie dabei auf die Autorenseiten oder Listen. Das ist noch nicht erkennbar, ist aber alles schon recherchiert. Die Seite wird also groß, ist aber durchkonzipiert. Für Politik plane ich ähnliches. Naturwissenschaft kann sehr kurz sein, weil da schon die ganzen Unterseiten existieren. @Jowinix: Magst du diese Themenseite erstellen? Eher "bunte", (in meinem Verständnis) also unsystematische Seiten, bringen dem Leser eher nichts. Wir können als Alternative aber auch einfach auf die entsprechenden Abschnitte der Seite Thema verweisen. Denn Literatur wird unglaublich viel Arbeit machen, völlig klar. --Koffeeinist (Diskussion) 10:33, 15. Jul. 2014 (CEST)
Reinquetsch: Naturwissenschaft als Anfang --Jowinix 15:53, 25. Sep. 2014 (CEST)

Hallo, nur so als Idee: vielleicht könnte man die Hauptseite mit der Wikipedia-Vorlage Zufallsbild noch etwas auflockern.--Sinuhe20 (Diskussion) 16:52, 31. Jul. 2014 (CEST)

In der Willkommens-Box sollte betont werden, dass deutsche Quelltexte gesammelt werden, so wie es bei Wikisource:Über_Wikisource#Quellentexte steht.--Sinuhe20 (Diskussion) 19:33, 24. Sep. 2014 (CEST)

Neusortierung / Ausrichtung auf Nutzer[Bearbeiten]

Hier ein paar Beobachtungen von meiner Seite:

  • Bei fast allen Boxen und fast allen Texten handelt es sich um Listen. Zumindest der Willkommenstext könnte aber in etwas ansprechenderer Prosa gehalten sein.
  • Wie Sinuhe finde ich auch, dass der Willkommen-Text plastischer gestaltet werden sollte. Formulierungen wie „Wikisource versteht sich als Qualitätsprojekt, das mit Scans einer jeweils zuverlässigen Textgrundlage arbeitet“ ist doch sehr stark komprimiert und keineswegs allgemein verständlich. Außerdem wird er der Vielfalt an Aktivitäten und Angeboten nicht gerecht, denn neben der Arbeit an Texten haben wir ja auch die Erschließung von Quellen („Digitalisaten“) und Wissensgebieten zu bieten. (Nebenbei gesagt halte ich „Quellentexte“ für einen problematischen Begriff, weil ja die wenigsten Texte bei WS Quellentexte im engeren Sinne sind (Gedichte ja genausowenig wie Artikel aus Illustrierten oder Dramen etc.) und weil ja viele Quellen gar nicht in Form von Texten vorliegen.)
  • Verschlankung. Ich finde, wir sollten auch unsere Begriffe ein wenig abrüsten und schlage vor:
    • Kürzlich hinzugefügte Quellen > Neue Texte
    • Kürzlich hinzugefügte Übersichtsseiten > Neue Themen
    • Auswahl aus unserem Bestand > Projekt-Auswahl
    • Wichtige Themenseiten > Überblick
    • Wikisource Aktuell – kann wahrscheinlich einfach entfallen. Allzuviel Neuigkeiten haben wir nicht und besonderer Andrang beim regelmäßigen Befüllen herrscht auch nicht. Stattdessen vielleicht besser Jahrestage nach oben.
    • Auch Wikisource:Auskunft können wir uns wohl sparen. Die Seite zeigt drei Anfragen von 2012/2013 von Wassermann, keine einzige wurde beantwortet. Damit wären wir schon in der "Willkommen"-Box.
    • Wikisource:Skriptorium und Wikisource:FAQ gehören eindeutig zur Abteilung für (künftige) Mitarbeiter.
  • Vielleicht sollten insgesamt die "Nutzer-" und "Mitarbeiter-"Aspekte besser getrennt werden, wobei die Willkommensseite vornehmlich auf die Nutzer hin ausgerichtet sein sollte. Und sie sollte die einfachsten Fragen einfach beantworten:
    • Was ist das hier? (die fünf wichtigsten Punkte)
    • Was gibt es hier? (Übersicht)
    • Was kann ich hier durch ein paar einfache Klicks entdecken? (Beispiele)

Lieber eine durch Symbole/Bildchen geführte Klick-Erkundungs-Tour, als endlose Listen mit Klick-Links. Warum nicht eine visualisierte Site-Map?

  • Kleines Zwischen-Fazit: zu großes Durcheinander an Aspekten und Funktionen, zu wenige Einladungen, den großen Eisberg zu erkunden. Verwirrende Vielfalt mit teils staubiger Ansprache. Aber darin sind wir uns ja wahrscheinlich weitestgehend einig. Soweit erst einmal. Viele Grüße --Konrad Stein (Diskussion) 00:22, 25. Sep. 2014 (CEST)

Hauptseite "Wikisource Aktuell"[Bearbeiten]

Hallo! Mir ist aufgefallen, dass in diesem Kästchen auf der wikisource-Hauptseite beide vorgestellten Werke gar nicht in der wikisource sind. Wir haben so ur viel Lesenswertes, könnten wir nicht dort zB die 2 letzten fertigen größeren Projekte reingeben, anstatt externe scans ohne wikisource-transkription zu verlinken? Vielleicht gibt es wichtige Gründe warum es so ist wie es jetzt ist, vielleicht kann mich ja wer erleuchten :-)

--AndyleeHeute schon gelobt? 17:01, 2. Aug. 2014 (CEST)

Lieber Andylee, in erster Näherung würde ich sagen, dass bei WS edierte Texte unter "Kürzlich hinzugefügte Quellen" angezeigt werden (und neue Themenseiten unter "Kürzlich hinzugefügte Übersichtsseiten" – beides ließe sich vielleicht mal umbenennen). Zudem erschöpft sich WS ja nicht in der Bereitstellung von Texten sondern nimmt auch die Erschließung von Zeitschriften (wie in diesem Fall) oder die Bibliographie von Themenbereichen in die Hand – als digitale Bibliothekare gleichsam.
Die Kästen lassen sich sicher anders gruppieren, zusammenfassen, etc. – daran wird gerade gearbeitet.
Insgesamt enthält "Wikisource Aktuell" überwiegend Statistik, denn Aktualitäten fallen hier nur wenige an. Vielleicht ist die Rubrik auch entbehrlich. Viele Grüße von --Konrad Stein (Diskussion) 18:19, 2. Aug. 2014 (CEST)
Danke für die schnelle Antwort. Die Statistik verstehe ich, das ist ja auch was Aktuelles. Die Idee der digitalen BiblothekarInnen finde ich nett, aber wenn der Titel der Box Wikisource aktuell ist und der Inhalt nur am Rande wikisource... egal, ich freue mich darauf, irgendwann mal das Ergebnis der angekündigten Neuordnung zu sehen :-) --AndyleeHeute schon gelobt? 00:34, 3. Aug. 2014 (CEST)
Lieber Konrad, Wikisource ist eine Sammlung von Quellentexten, … lese ich auf unserer Hauptseite und bei Über Wikisource. Über die von dir oben konstatierte Erweiterung des Projektziels konnte ich auf die Schnelle nichts finden. --9xl (Diskussion) 09:11, 3. Aug. 2014 (CEST)
Nun, jede Themen- und Autorenseite widerspricht diesem Diktum. Wäre vielleicht auch renovierungsbedürftig. Viele Grüße --Konrad Stein (Diskussion) 22:02, 3. Aug. 2014 (CEST)
9xl, ich sehe da wirklich keinen Widerspruch. Denn ob die Quellen hier gesammelt werden oder ob wir verstreute und schwer zugängliche Digitalisate an einer Stellen übersichtlich verlinken und mit weiteren Informationen anreichern, beides führt im Effekt zu einer Quellensammlung. Aber es stimmt schon, die beiden Zeitschriften müssen nicht unbedingt unter Aktuelles stehen, wir haben Zeitschriften sonst immer bei den Themenseiten aufgelistet. --Koffeeinist (Diskussion) 23:31, 3. Aug. 2014 (CEST)
Widerspruch ist vielleicht ein bisschen dick, aber Text ist nicht gleich Digitalisat. --9xl (Diskussion) 10:02, 4. Aug. 2014 (CEST)

Ich habe leider die Übersicht verloren: wo wird die Überarbeitung der Hauptseite gerade verhandelt? Ich würde mich an den Überlegungen auch aktiv beteiligen. --Konrad Stein (Diskussion) 09:44, 4. Aug. 2014 (CEST)

#Begrüßungsbox auf der Hauptseite und Benutzer:Koffeeinist/Hauptseite. --9xl (Diskussion) 10:02, 4. Aug. 2014 (CEST)

Hallo, ich würde es gut finden, wenn unter dieser Rubrik größere abgeschlossene Projekte präsentiert werden. Wenn vollständige Digitalisatsammlungen zur Verfügung stehen und verlinkt wurden oder größere Werke inhaltlich erschlossen (wie z.B. die Musikzeitschriften), fände ich das auch sehr informativ.--Sinuhe20 (Diskussion) 09:48, 4. Aug. 2014 (CEST)

@Konrad: Sehr gern. Den aktuellen Diskussionsstand findest du weiter oben in der Skriptoriumsdiskussion. Es muss im Prinzip folgendes geschehen. Wir hatten uns darauf geeinigt, nach und nach einige größere Themenseiten anzulegen. Geschichte lege ich gerade an, das wird noch etwas dauern, dann aber sehr nützlich sein. Auf meiner Unterseite findet sich die Begrüßungsbox, die gekürzt werden soll. Ein bissl Abwechslung kann mit der Vorlage Überraschungsbild reingebracht werden (muss die importiert werden?). Wenn das getan ist, sollten wir uns noch über die Neuverteilung der anderen Boxen (Platzierung, kürzen, rauswerfen) einigen. Der bisher erreichte Konsens geht zum Kürzen. --Koffeeinist (Diskussion) 10:44, 4. Aug. 2014 (CEST)
Meine Güte! Ich kann ja einiges ertragen, aber bitte nehmt Abstand das Überraschungbild des Tages auf unserer Hauptseite anzuzeigen, das passt doch gar nicht zu unserem Profil c:User:Überraschungsbilder/Archiv. – Paulis 12:20, 4. Aug. 2014 (CEST)
Wieso, Findste die Mieze nich süß? --9xl (Diskussion) 13:01, 4. Aug. 2014 (CEST)
Man könnte ja einen kleinen Pool an Bildern (Bücherregale, Buchrücken etc.) anlegen, die in gewissen Abständen rotieren. Einige schöne gibt es doch schon. --Konrad Stein (Diskussion) 13:53, 4. Aug. 2014 (CEST)
Ich hätte eher so an schöne Illustrationen aus Büchern und Zeitschriften gedacht… --Sinuhe20 (Diskussion) 08:38, 5. Aug. 2014 (CEST)

BUB (Book Uploader Bot) für Google nach IA[Bearbeiten]

und anderen Varianten. Link: http://tools.wmflabs.org/bub/index

Vorteile:

  • Bestechend einfach und schnell. (Ausnahme: angebliche erkannte Dubletten, siehe unten) Einhändig zu benutzen, man kann nebenbei noch ein, zwei fette Dampfnudeln mit Weinsauce essen.
  • Kein Internet Archive Account notwendig, für den man bekanntlich eine Zweit(Müll)- oder Wegwerf-Emailadresse braucht, weil diese in den Metadaten ohne Spamschutz verzeichnet wird.
  • Anonym. Kein Wikimedia-Login erforderlich. Lediglich der Wikimedia-Server erhält die eigene IP
  • Nichts muss getippt, kopiert oder sonst wie angegeben werden außer der blanken Google Buch-ID, wahlweise auch der ganzen URL.
  • Die eigene Email-Adresse muss nur angegeben werden, wenn man über die erfolgreiche Einstellung benachrichtigt werden möchte, was man sich meiner Meinung völlig sparen kann aus folgendem Grund:
  • Die ID des Internet Archive Uploads lässt sich ganz einfach aus der Google-ID ableiten, man muss sie sich nicht eigens merken, Hauptsache man die Google-IDs seiner Uploads noch zur Hand. Beispiel {{IA|bub_gb_KuY-AAAAYAAJ}} = {{GBS|KuY-AAAAYAAJ|US}} gleich Internet Archive = Google-USA* Man muss also weder abwarten bis der Link online im Verlaufsprotokoll erscheint, noch braucht man eine Mail dazu. Der Link zum IA funktioniert in der Regel nach wenigen Minuten, bis dieses aber alle Derivate fertig hat und online gelesen werden kann, können je nach Auslastung einige Stunden vergehen. In der IA-Suche erscheint der Titel jedoch nicht sofort, da der Index nicht so schnell aktualisiert wird)
  • Der Bot holt nicht die PDF, die Google zum Download anbietet (welche leider seit dem "Bücherklau" des IA-Users "tpb" für das IA durch Capcha-Abfrage geschützt ist)
  • Unterstützt auch einige andere Quellen (Bibliotheken) als nur Google und soll auch dahingehend (auf Wunsch?) ausgebaut werden können.
  • Offenbar gibt es durch den direkten Download der Bilddateien keine Probleme mit Buchillustrationen im IA-Online-Reader, wie es beim Download der Google-PDF häufig der Fall ist oder war, wo Abb. im Buch in einem anderen Grafikformat vorliegen und Online im IA-Reader fehlen, aber in der PDF weiter enthalten sind und im lokalen PDF-Viewer angezeigt werden. Wenn ich damit richtig liege, dann wäre ein Neu-Upload wichtiger, bei uns verlinkter illustrierter Werke zu überlegen, wenn es keine Alternativ-Digitalisate gibt.


Nachteile:

  • Die Metadaten der Titel werden von Goggle übernommen und sind deshalb genauso grottig (insbesondere bei Zeitschr., Reihen und versch. Aufl.) wie schon bei der halben Million Titel, die seinerzeit der Superuser "tpb" botmäßig eingestellt hat.
  • Da die Titel unter dem Account des Bots eingestellt werden, kann man die Metadaten nicht nachträglich verbessern, außer sie ggf. nebst Schlagwörtern und anderen Hinweisen ins Kommentarfeld zu kopieren, welches jeder eingeloggte Benutzer überall nutzen kann und dessen Inhalt auch in der normalen Suche berücksichtigt wird.
  • Der Bot prüft zunächst das Internet Archive auf Doubletten (und zeigt sie als maskierte Kurzlinks an), was eigentlich eine gute Idee wäre. Aber weil die Suche nicht etwa nach eindeutigen Stings wie der Googgle-ID, sondern nach (wie ich glaube ausschließlich – Script) gleich lautenden Titelzeilen aller IA-Bücher läuft, muss man bei Zeitschr., Reihen und versch. Aufl. häufig den Uploadwunsch erst mit einem nervigen, schlecht lesbaren Capcha bestätigen. Falls der Bot bei seinen Admin-Massenuploads (siehe unten) ebenfalls so prüft und die angeblichen Doubletten nicht vom Admin nach gearbeitet werden, was ziemlich aufwändig, genau genommen überhaupt nicht zu leisten wäre (Blick ins Buch, ggf. auch Zwischentitel, nachsehen in OPACs etc.) dann würden dabei unzählige Titel einfach unter den Tisch fallen. (z. B. alle restlichen Titel einer Reihe oder häufige Titel wie "Gedichte") Der User "tpb" verzichtete damals auf eine solche Doublettenprüfung (und das ganz sicher mit dem Segen des IA, zu deren höchsten Reihen/Umfeld dieser auch anderweitig tätige Netzaktivist zuzurechnen war und leider auch nicht mehr lebt R.I.P.), bestenfalls fing er Doppeluploads mit identischer Google-ID ab. Der Botbtreiber sollte zumindest für das Uploadziel IA (soll ja auch für Commons entwickelt worden sein) darauf verzichten oder auf die Google-ID einschränken, oder eine einfache Ein-Klick-Bestätigung statt Capcha einbauen. Mir geht jedenfalls diese Abfrage so auf den Senkel, dass ich echt einen Horror kriege, wenn ich an unsere Zeitschriftenlisten denke.
  • Der Bot-Betreiber macht (selbst?) auch scheinbar wahllos Massenuploads, der Zugang erfordert jedenfalls ein Admin-Login. Aktuell wird eine Liste von rund 45.000 Titel abgearbeitet Liste der IDs – Lange Ladezeit!(welche wahrscheinlich auch ständig wieder nachgefüllt wird), wobei einzelne Useruploads offenbar Vorrang haben, sonst würde es viele Monate dauern, bis man an der Reihe wäre. Den Bot gibt es erst ab Frühjahr, im jetzigem Funktionsumfang erst seit wenigen Wochen und schafft so etwa ca. 40 Titel pro Stunde Aktueller Stand der IA-Uploads, neuste zuerst, davon deutschsprachig, unter den letzten 100 viele von mir (bei manueller Bot-Nutzung dauert es natürlich wesentlich länger). Die Geschwindigkeit gibt der Toolserver (wie der alte, lahmt auch er gerne mal oder fällt gleich ganz aus und bringt eine Errorseite) für Download und PDF-Erstellung und das IA für Upload und Derivateerstellung vor.
  • So sehr ich in Sachen Bücherdigitalisate alles unterstütze, was die Abhängigkeit von einer Privatfirma vermindern kann, scheint mir der Massenupload zu 90% oder gar mehr nur Eulen nach Athen zu tragen, da erstens die allermeisten Titel nicht nur schon bei Goggle, sondern parallel dazu auch bei fast allen Partnerbibliotheken wie z. B. MDZ, Hathi usw. völlig frei zugänglich sind. Eine sinnvollere Vorgehensweise, z. B. zunächst einmal nur die Proxytitel ab 1874 zu nehmen wäre wünschenswert. Darüber hinaus besteht das Risiko, dass Google künftig den Download der einzelnen Seiten erfolgreich erschwert oder verhindert, etwa durch Kacheln, Zerhacken, ekelige Scripte usw., wie es eben schon beim PDF via Captcha der Fall ist, bevor die wirklich schlecht zugänglichen Proxy-Titel in nennenswertem Umfang gesichert werden können. An andere Gefahren, wie die eines vorzeitigen Ablebens des Bots (Druck von Google auf Wikimedia mit der Rankingkeule etc.) mag ich da noch gar nicht denken.
  • Die im Library-Auswahlmenü versprochene Unterstützung von Hathi als Quelle scheint ausgerechnet bei Google-Scan von Hathi unmöglich. Ein anderers Tool, der Hathi-Download-Helper kann das aber. (Fehlermeldung: Oh snap! This book is Google-digitized. Hathitrust does not allow download of Google-books through their servers. But dont worry, you may search for this book on Google-books and enter that ID/URL, with Google-Books as selected library.) Abgesehen davon, dass mir in all den Jahren nie Buch bei Hathi aufgefallen ist, welches nicht von Google gescannt wurde, wäre gerade mir diese Möglichkeit für die WS-Listen sehr wichtig, da viele bei Hathi unter Proxy, ja sogar einige ohne Proxy einsehbaren Titel (z. B. Titel bis 1923, moderne Reprints gemeinfreier Werke, wo bei Google alleine das Druckjahr und nicht Gemeinfreiheit an sich maßgebend ist, oder bei Hathi auf Anfrage durch Nachweis der Gemeinfreiheit freigeschaltete Titel) welche bei Google ganz gesperrt oder überhaupt nicht vorhanden sind, so dass auf normalem Wege überhaupt keine PDF zu erhalten ist, weder von Hathi (außer über umständliche Umwege mit dem Hathi-Download-Helper) noch von Google. Hier wäre so ein Bot sinnvoll, der die Funktionenen des Hathi-Download-Helper mit den bereits vorhandenen verbindet. Ich alleine hätte mindestens 1500 Titel auf meiner Wunschliste. Es ist jene Liste, mit der ich einst den Hathi-Download-Helper gefüttert habe, aber zur Nachbearbeitung der Bilddateien (PDF-Erstellung und Upload) noch immer nicht gekommen bin und deren unterschiedliche Bildformate (TIFF für Textseiten und JPEG für Abbildungen bzw. was Google eben als solche erkannt hat) Probleme mit dem IA-Online-Reader machen.

Ich wäre dankbar, wenn andere den Bot mal testen würden und vielleicht auch helfen könnten, weiteres an Hintergründen, Technik Quelltexte), Ausbaupläne in Erfahrung bringen bzw. meine Angaben dazu korrigieren oder eine kleine Anleitung nebst Beschreibung auf unseren Hilfeseiten entwerfen helfen oder auch direkten Kontakt mit dem Entwickler/Betreiber (User aus Neu-Delhi) zwecks Dank, aber auch zur Diskussion der genannten Vorschläge bzw. Kritikpunkte aufnehmen könnten. Möglicherweise, wie mir eben erst dämmert, kann aber auch jemand anders der Python versteht, zum Beispiel aus WP/WS-de eine Variante des Bots mit für uns geänderten Spezifikation auf dem Toolserver installieren, dann bräuchte man dem Entwickler nicht zu sehr auf die Pelle rücken.

Weiter wäre interessant zu wissen, ob und wie Leute mithelfen möchten, systematisch (gelegentlich darf und soll natürlich auch jeder) unser Listen mit Google-US-Titel abzuarbeiten ohne dass man sich in die Quere kommt oder die Zeit mit Doppelsichtungen zu vergeuden. (Seitenmarkierung etc.) --Rumpelsteig (Diskussion) 15:06, 20. Aug. 2014 (CEST)


Also das sind ja mal echte Neuigkeiten. Zunächst einmal vielen Dank für die umfängliche Berichterstattung. Ich habs noch nicht ganz verdaut/begriffen (z.B. „Der Bot holt nicht die PDF, die Google zum Download anbietet“, sondern?), kann daher noch nichts qualifiziertes dazu sagen, gebe Dir aber schon darin Recht, dass Bücher nach 1878 Vorfahrt haben sollten. Gerne arbeite ich auch systematisch mit. Vielleicht sollte es dazu aber eine eigene Projektseite geben. Viele Grüße --Konrad Stein (Diskussion) 18:30, 20. Aug. 2014 (CEST)

Ja, der Text ist so lang, dass ichs schon selber nicht mehr finde, deshalb suche ich ja auch Leute, dies aufn Punkt bringen können. Der Bot holt die Bilder aus dem Google-Online-Reader, die man sich auch selbst einzeln abspeichern kann, wenn man die altbekannten Tricks wie Rechtsklickverhinderung, Überlagerung usw. abstellt, was ja fast jeder im Browser per Einstellung oder Add-on schon für anderen Gelegenheiten, z.B. für Karten, PD-Bilder gemacht hat. Es gibt aber noch ein anderes Tool, ein kleines eigenständiges Programm, welches ich schon ein paar Tage früher entdeckt hatte und ebenfalls hier vorstellen wollte bzw. noch will, welches auch alle Bilddateien, also Seiten eines Google-Buches in höchster Auflösung holt und als eigenes PDF abspeichert. Die hat den Vorteil, dass die Qualität des daraus erstellten PDFs viel höher ist als bei der PDF, mit der Google und im Downloadbereich abspeist. Offenbar machten sie eine Schrumpfkur mit ihren PDFs. Mir ist schon lange aufgefallen, dass die Dateigröße der Google-PDFs, mit gleichen IDs wohlgemerkt, welche ich vor Jahren abgespeichert habe, viel größer war als heute. Vielen Dank natürlich auch für dein Interesse, du machst ja in diesem Bereich seit Jahren schon mehr als jeder andere. Mit systematisch abarbeiten meine ich vor allem, dass jeder seine Listen oder die Listen seines Interesses checkt, so nebenbei den Bot füttert und es irgendwie vermerkt, wenn man ganz durch ist mit einer Seite --Rumpelsteig (Diskussion) 19:34, 20. Aug. 2014 (CEST)

Übrigens, was für digitale Bibliotheken gibt es auf Deutsch? Wenn ihr wollt, konnte man ein paar als standard Option in BUB festlegen. Für Katalanisch haben wir die BNC/MDC angefordert, und das macht viel einfacher Dateien zu importieren.--Micru (Diskussion) 11:48, 21. Aug. 2014 (CEST)
Hallo Micru, Danke der Nachfrage. Wir haben hauptsächlich die Bayerische Staatsbibliothek (Bspl.: MDZ München), die mit Google kooperiert. Allerdings sind deren angebotene PDF sehr groß bei gleichzeitiger schlechter Auflösung. Die einzubinden wäre also nur sinnvoll, wenn man hohe Auflösungen herunterladen kann und die gut komprimiert zusammenbindet. --Konrad Stein (Diskussion) 17:51, 23. Aug. 2014 (CEST)
Die Illustrirte Zeitung scheint als Pdf-Download beim MDZ eine etwa doppelt so hohe Auflösung zu haben, wie das, was bei Google angezeigt wird. Hier auch mal der Vergleich von zwei einzelnen Seiten: MDZ vs. Google.--Sinuhe20 (Diskussion) 19:43, 9. Sep. 2014 (CEST)
@Sinuhe20: Ja, deren PDFs sind deutlich größer. Man kann, falls dies überhaupt Sinn macht, eine MDZ-PDF manuell mit dem Uploader in das IA schaffen. Im Kartenreiter statt Google-Books Manual-Wildcards nehmen und dort statt images PDF-Link auswählen, den Link (muss beim MDZ vorher manuell erzeugt werden und wird auch nicht ewig zum Download vorgehalten) und die Metadaten eingeben. Allerdings hat das IA Probleme mit (insgesamt) sehr großen PDFs, etwa Jahresbänden von Zeitungen. Bei Versuchen mit PDFs von anderen Bibs konnten teils keine Derivate erzeugt werden und hängen ewig in der Mache (Queue), womit auch kein Onlinelesen, Seitenverlinken möglich ist. Der einzige Grund vom frei zugänglichen MDZ direkt Titel ins IA zu laden, wären dauerhafte Verlinkungen auf einzelne Seiten, etwa bei Zeitschrifteninhaltslisten. Das MDZ bietet noch immer keine persistente URL auf Seiten, weshalb es bei unserer Vorlage dafür auch keinen Parameter gibt. Gewöhnlich reicht aber auch die Google-Kopie dazu, die, wenn man Google auch keine Dauerhaftigkeit zuschreiben will (ich selbst halte zumindest alles, was über die blanke ID hinaus verlinkt wird, Seitenzahl, Worthervorhebung etc. für hoch riskant), einfacher in das IA zu schaffen wäre. Das MDZ hat beim Google-Scan-Programm sehr wenig, wovon nicht auch eine Kopie bei Google proxyfrei zu sehen ist. --Rumpelsteig (Diskussion) 21:21, 9. Sep. 2014 (CEST)

Bei ein paar hundert Testläufen habe ich die Erfahrung gemacht, dass der Bot sehr schnell reagiert und bearbeitet und dass sich viele Prozesse (mehr als zwanzig) gleichzeitig (in verschiedenen Tabs/Fenstern) betreiben lassen. Man scheint auch bei den Captchas von den dämlichen Zweiwortentstellungen auf die recht praktischen Hausnummern umgestellt zu haben, zumindest lief das heute so. Also insgesamt schon eine sehr große Hilfe. Folgende Verbesserungsvorschläge hätte ich (mit großer Schnittmenge zu Rumpelsteig):

  • Möglichkeit Listen abarbeiten zu lassen (statt je einzelne IDs). Wenn schon nicht unbegrenzt, so doch in größeren Quantitäten. Zumindest für WP/WS-User mit aktivem Account.
  • email-Nachrichten nur auf Nachfrage (Default: deaktiviert).
  • keine Bestätigungsroutine bei "ähnliche Bände bereits vorhanden" um Zeitschriftenjahrgänge/Buchreihen ungehindert uploaden zu können. Besser ein Abgleich der Google-ID statt des Titels.
  • Freigabe der IA-Metadaten-Bearbeitung des Bot-Accounts für WM/WP/WS-User.
  • Übernahme der Google-OCR statt eine eigene OCR zu erstellen (die bei IA immer fraktur- und sonderzeichenbehindert (Deutsch) ist). Wenn man die Einzelscans abgreifen kann, warum nicht auch die OCR?
  • Was vergessen? Mal sehen. Viele Grüße --Konrad Stein (Diskussion) 17:51, 23. Aug. 2014 (CEST)


Ein bisschen wird die Freude über das handliche Werkzeug dadurch getrübt, dass keineswegs die bekannten GBS-PDFs gespiegelt werden, sondern dass die PDFs aus Scanmaterial neu erstellt werden (so scheint es jedenfalls). Die Resultate ähneln den PDFs, wie man sie aus Toronto kennt: alles zwar lesbar, aber, je höher man vergrößert, desto unschärfer. Statt gestochene Schwarz-Weiß-Resultate eher ein Grau-in-Grau-Schleier. Zudem eine deutlich schlechtere Auflösung bei gleicher Dateigröße. Offensichtlich sind da ganz andere Kompressionswerkzeuge im Spiel. Schade. Und die OCR ist gleichbleibend schlecht. --Konrad Stein (Diskussion) 15:25, 9. Sep. 2014 (CEST)


Also, ich habe mal dem Mass-Uploader eine Liste mit gut 300 Links gegeben: Aetas Kantiana. Wenn es das sauber abarbeitet ist das Geschäft schnell verrichtet. Da ich mit grep arbeite, kann ich eine Seite wie diese in weniger als einer Minute bearbeiten. Wie gehst Du vor? Falls es für Dich erheblich komplizierter ist, kann ich auch zügig eine Liste von Themenseiten abarbeiten. Vorausgesetzt, der Mass-Uploader spielt mit – was sich aber rasch zeigen sollte. Momentan ist der mass-uploader-queue knapp 12.000 IDs lang (die übrigens alphabetisch sortiert sind, von T-Z zu diesem Zeitpunkt); meine waren (nach einer halben Stunde) nicht dabei, im IA waren sie aber auch (noch) nicht. Mal sehen. Bis später, Dein --Konrad Stein (Diskussion) 13:39, 7. Sep. 2014 (CEST)

Danke, das sind ja schöne Neuigkeiten. Mail müsste jetzt gehen, falls noch nötig, ist aber keine Realnamenadresse sondern eine Unteradresse für Wikipedia. Grep habe ich nicht, aber es gibt ähnliches für win/dos. Am meisten interessiert mich, wie mit angeblichen Dubletten umgegangen wird bzw. ob die Prüfung, ggf. auf Wunsch, ausgesetzt wird. Irgendwie könnten wir eigentlich eine Liste ALLER GBS-US Links auf WS brauchen (Die Weblinksuche auf WS unterscheidet aber nicht zwischen Google und Google-USA, aber weil USA in der Vorlage steht, müsste man diese irgendwie anders filtern können) und so ein Abgleichsautomat wie bei BUB eingebaut, dann hätten wir wenigstens alle IDs, die sicher keine Dubletten sind für den Mass-Upload. LG --Rumpelsteig (Diskussion) 14:45, 7. Sep. 2014 (CEST)

@Rumpelsteig: Falls so gemeint, hier die US der Autoren von heute. Du könntest bei Bedarf spaßeshalber mal nachsehn obs so einigermaßen hinhaut. Wenns passt, könnten noch Listen oder Themen dazukommen. – Paulis 21:28, 7. Sep. 2014 (CEST)
Vieeeelen Dank, Paulis! 8515 Titel alleine bei den Autoren. Damit kann ich zumindest selber mal den Abgleichsautomaten spielen oder wir reichen die Liste einfach ganz frech ungekürzt dem Bot weiter, allerdings gibts dann Massen an Dubletten, falls er diese nicht überspringt. Ich weiß nicht ob wir das im ersteren Falle dem IA antun können, die kommen vielleicht kaum mit dem Nachkauf von Platten hinterher. Ich melde mich gerne, wenn ich andere Themen brauche. Hast du das mit dem Catscan hingekriegt? Ich hatte vor lauter uppen noch kein Nerv mich umzuschauen und Catscan ist eh nicht mein bester Freund. Liebe Grüße, dein ergebenster --Rumpelsteig (Diskussion) 22:33, 7. Sep. 2014 (CEST)
CatScan listet mir die Autorenseiten und die werden über Spezial:Exportieren als XML-Datei gespeichert. Suchen, finden und ersetzen macht Notepad++. Das geht bestimmt eleganter, aber immerhin ;-) – Paulis 22:45, 7. Sep. 2014 (CEST)

Liebe Mitstreiter, Hallo Konrad Stein, Hallo Paulis, nach durchrungenen Nächten unter Beteiligung aller multiplen Persönlichkeiten durchrangen wir uns uns ja endlich zur Durchreichung unserer ungekürzten Wünsche an den Heinzelmann. Es ist soweit! (Es saugt und schiebt der Heinzelmann.....) Bisher sind ca. 1700 der 8500 GBS-Proxy-Titel von deiner Liste, Paulis, eingestellt, der Rest dürfte so in ca. einer Woche fertig sein. Ich hatte es selbst lange nicht bemerkt und war ziemlich überrascht, denn ich wähnte zunächst viele fleißige Helfer am Werk. Es sind diese Kraut- und Rüben Titel, welche die letzten Tage quer Beet scheinbar ohne sinnvollen Zusammenhang dort auftauchen. Man erkennt sie in der Liste deutschsprachiger Neuzugänge an den IDs der alphabetisch abgearbeiteten Liste, eben ist AY.... durch. Es macht also derzeit für eventuelle Mithelfer keinen Sinn, irgendwelche Titel, die auf unseren Autorenseiten verlinkt sind, manuell per BUB-Uploader hochzuladen. Deine Liste, Paulis ist, wer weiß warum, auch nicht in der Mass-Upload Queue zu sehen, dort läuft weiterhin diese Liste italienischer Titel, welche ursprünglich ca. 50.000 Titel hatte und jetzt auf unter 10.000 geschrumpft ist. Das Verlinken der neuen IA-Backups auf den Autorenseiten macht natürlich auch erst Sinn, wenn die Liste ganz durch ist, weil auf einer einzigen Seite IDs unterschiedlichster Anfangszeichen vorkommen. Man könnte sich nun Gedanken machen, wie wir dies sinnvoll und zügig fortführen wollen, bevor das SEK mit 20 Mann im Flur steht und mir die Dampfnudel aus dem Gesicht fällt. --Rumpelsteig (Diskussion) 18:32, 9. Sep. 2014 (CEST)

Bleibt für mich die Sinnfrage: Was bringt das Quergeschiebe von Dateien von GBS, GBS-US, HT, HT-US zu IA? Die Dateien bleiben im amerikanischen Raum und damit der amerikanischen Jurisdiktion unterworfen. Sollte es Änderungen oder politische Motivationen geben etc, dann betrifft das ja wohl auch das IA. Einzig sinnvoll erschiene es daher, die Dateien in den europäischen Raum zu verschieben --De-ZD (Diskussion) 13:50, 7. Feb. 2015 (CET)

Stand der Dinge[Bearbeiten]

Bester Rumpelsteig, bitte lass uns doch kurz den Stand der Dinge wissen. Ich hatte verstanden, dass Du gerade die Liste aller GBS-US-pdfs der Autorenseiten abarbeitest. Ist dem so? Gibt es neue Beobachtungen? Was siehst Du als nächste Schritte? Viele Grüße von Deinem --Konrad Stein (Diskussion) 10:23, 15. Sep. 2014 (CEST)

Aktuell[Bearbeiten]

Offenbar seit 16.4.15 keine neuen uploads BUB Hat jemand Infos? lg--De-ZD (Diskussion) 09:56, 7. Mai 2015 (CEST)

Liste der Autoren aktualisieren[Bearbeiten]

Hallo, der "aktuelle" (Satire?) Stand von Liste_der_Autoren wird mit 22. 12. 2014, 23:16 (UTC) angegeben. Wie läuft das mit der Aktualisierung? Könnte das script nicht 1 mal am Tag die Seite generieren? Was spricht dagegen? Die "normalen" Autorenseiten sind - für mich - durch die eigenwillige Darstellung (Vornamen - Nachname) bei der Suche nach Autoren unpraktisch, dagegen die Liste_der_Autoren (Nachname, Vornamen) für mich wesentlich handlicher. Gruß --De-ZD (Diskussion) 08:43, 23. Jan. 2015 (CET)

Das Update wird jedesmal manuell gemacht. Wenn du es kannst, gerne auch täglich; ich nehme aber an, dass damit etwas Aufwand verbunden ist (ich persönlich habe keine Ahnung, wie das funktioniert). Und dass die Seite aktuell ist, wird nirgendwo behauptet, oder habe ich da was übersehen? --Dorades (Diskussion) 21:27, 23. Jan. 2015 (CET)
Die Seite wird mit dem auf der Diskussionsseite beschriebenen Skript anhand des aktuellen Dumps auf [4] aktualisiert. Dieser Dump wird anscheinend in immer größeren Abständen erstellt und wenn ich diese Liste richtig interpretiere, dürfte der Neueste auch noch einige Tage auf sich warten lassen.
Einem manuellen Eintrag einzelner Autoren steht dem aber nicht entgegen. --WaldiWuff (Diskussion) 22:03, 23. Jan. 2015 (CET)
Die Kategorie:Autoren ist alphabetisch und aktuell. Die Liste ist für die Katz. --9xl (Diskussion) 10:45, 24. Jan. 2015 (CET)
Die Liste ist für die schnelle Suche sehr gut geeignet. Zumindest bei mir dauern Catscans immer relativ lange. --Koffeeinist (Diskussion) 11:12, 24. Jan. 2015 (CET)
Das Aktualisierungsintervall der Dumps ist jetzt so bei 40 Tagen und wird nicht kürzer werden. Ich persönlich würde das verkraftbar finden, sofern das immer mit jedem Dump gemacht wird (ist hier jemand regelmäßig dabei?). Falls das aber wochenaktuell werden soll müsste man darüber nachdenken das Skript zu einem Botskript umzubauen, welches wöchentlich (öfter macht wenig Sinn) die Kategorie Autor durchsucht. Besteht da der Wunsch? --THE IT (Diskussion) 13:25, 24. Jan. 2015 (CET)
Es besteht der Wunsch. Es besteht sogar ein großer Wunsch. Das wäre toll, wenn das häufiger aktalisiert würde. Über das Zeitintervall kann man diskutieren. Täglich fänd ich besser, wenns doch dann eh ein Bot machen würde? Aber wöchentlich wär auch super. --De-ZD (Diskussion) 10:16, 25. Jan. 2015 (CET)
Dann mache ich mich mal bei Zeit und Muße da dran. Täglich wäre natürlich eine schöne Idee ... aber. Ich muss sehen wie die Laufzeit des Skriptes sein wird. Ich werde schon versuchen mit einem XML-Speicher zu arbeiten, dann kann man das vielleicht täglich durchlaufen lassen. MfG --THE IT (Diskussion) 20:28, 25. Jan. 2015 (CET)
Prima, hört sich sehr gut an. Ich schaue in der Zwischenzeit mal mal zu, daß noch ein paar Autoren dazukommen. Grüße --De-ZD (Diskussion) 20:35, 25. Jan. 2015 (CET)
Eventuell im neuen Skript auch berücksichtigen, dass mittlerweile einige Autoren mit Wikidata gefüttert werden (s. Adolphe Wurtz, Friedrich Schembor, …). Solange werde ich auf die Aktualisierung mittels Dump ein Auge haben. --WaldiWuff (Diskussion) 21:25, 25. Jan. 2015 (CET)
Ich schenke dir diesen Link, in den letzten fünf Tagen in der Kategorie Autoren neu erstellte Artikel. --9xl (Diskussion) 10:07, 26. Jan. 2015 (CET)
Ich wusste ich hätte mich mal mit diesem Tool beschäftigen sollen ;-). Das ist doch ein guter Ausgangspunkt. Dann wäre der Ansatz wie folgt:
  1. sofern ein neuer Dump bereit steht wird dieser durchsucht und alle Autoren werden aktualisiert.
  2. Jeden Tag (wenn mein Rechner hochfährt, kann also auch mal seltener sein) werden mit Catscan die Autoren herausgesucht die seit dem letzten Durchlauf des Skriptes hinzugefügt wurden. Diese werden dann der lokalen XML-Struktur hinzugefügt und diese erzeugt dann den Wikitext.
Frage: soll am Aussehen der Tabelle was verändert werden?
Auf Wikidata werde ich ein Auge haben und den regelmäßig erscheinenden Dump als Updatequelle nutzen. --THE IT (Diskussion) 13:52, 26. Jan. 2015 (CET)
Zu 2.: So ein inkrementeller Update hat Tücken, denn Autorenseiten können verschoben werden wegen Schreibfehler o. ä., oder auch gelöscht werden.
Noch etwas: Die Kategorie:Autoren enthält auch Benutzerseiten bspw. Benutzer:Goldpremium/Christa Anita Brück, die müssten aussortiert werden. --9xl (Diskussion) 19:37, 26. Jan. 2015 (CET)
Das mit dem Verschieben und Löschen wird durch das 40 tägige durchforsten des Dumps aufgefangen, welcher Autor dort kein Update erfahren hat fliegt wieder. Das mit den Benutzerseiten kann behandelt werden. Weitere Fehler können dann eigentlich nur mittels eines kleinen Ausnahmefiles behandelt werden. Welches dem Skript mitgeführt wird. --THE IT (Diskussion) 20:29, 26. Jan. 2015 (CET)
Ach so, ich dachte die Liste sollte aktuell sein und nicht ein bisschen und 39 Tage alt. --9xl (Diskussion) 09:21, 28. Jan. 2015 (CET)
Das hattest du völlig richtig verstanden. Ich kombiniere die beiden Ansätze. Es wird wann immer das Skript läuft überprüft, ob seit dem letzten Durchlauf ein Dump erschienen ist. Wenn dies der Fall ist wird dieser abgearbeitet und der Durchlauf des Skripts auf das Datum des Dumps gesetzt. Falls der Dump älter als der letzte Durchlauf ist wird der alternative Weg eingeschlagen und auf die Onlinedaten mittels Catscan gearbeitet. Ich würde das am kommenden Sonntag mal durchformulieren. --THE IT (Diskussion) 10:12, 28. Jan. 2015 (CET)
Mal grudsätzlicher, warum ein aktuelles Listchen sinnvoll ist: Der status ist doch so aus Nutzersicht, rein subjektiv, versteht sich: Ich suche eine(n) Autor, Hofmann, Hoffmann, Hoffmans, Hofmans, Hoeffmann oder so. Die wikisource-suche spuckt sagen wir mal 234.452 Einträge mit Gartenlaube aus. Ich weiß nicht genau wie der Autor genau heißt. Ich klicke also auf "Autorenindex" bei wikisource und: sehe ein unübersichtliches Gewusel aus "Unterkategorien" und A bis Z und nächste 200 und "Einträge in der Kategorie „Autoren“ und so weiter und so fort. Dann darf ich nochmal auf "H" klicken. Und mich dann durch die "nächste 200" schön langsam, sehr sehr langsam ... bits.wikimedia gelesen... durchklicken bis ich dann bei Ho bin. Ja, das ist schon benutzerfreundlich gemacht. Dabei muss ich ständig die Äuglein bewegen, weil man es versäumte, die Liste nach Nachname, Vorname zu strukturieren, was extrem nutzerunfreundlich ist, weil das Objekt des Interesses dadurch stets ein anderer Stelle steht. Daher: ich persönlich finde die Liste praktischer und wenn sie tagesaktuell wär, auch sehr gut nutzbar. Warum sollte man eine Sache, die eh schon da ist (Autorendatenbank) nicht so aufbereiten, das sie gut gebraucht werden kann?--De-ZD (Diskussion) 10:25, 28. Jan. 2015 (CET)

Auch ich wäre dankbar für eine möglichst automatisch aktuelle Liste. Mit 1 Monat (oder weniger) wäre ich schon zufrieden. Für jeden, der sich auch nur ansatzweise für Pflege der Autorenseiten interessiert, ist diese Liste ein Schatz. Aber ich vermisse noch andere Instrumente, um der nun schon über 6000 Seiten Herr zu werden, insbesondere wegen der anstehenden Verlinkung der Google-Kopien im IA und könnte dafür ein wenig technische Unterstützung brauchen, nichts kompliziertes, versteckte Kategorien usw. Mehr dazu später in einem eigenen Abschnitt. --Rumpelsteig (Diskussion) 13:11, 28. Jan. 2015 (CET)

sehe dem gern entgegen. --THE IT (Diskussion) 13:42, 28. Jan. 2015 (CET)

Es wäre gut, wenn in der Liste die Pseudonyme der Autoren -> |ALTERNATIVNAMEN= mit kämen. aktuell: Name | Geb.-datum | Tod.-datum | Beschreibung gut/besser wäre meines Erachtens: Name | Alternativer Name/Pseudonym | Geb.-datum | Tod.-datum | Beschreibung Gruß--De-ZD (Diskussion) 18:14, 4. Feb. 2015 (CET)

Machbar, sehe ich mit vor. Der aktuelle Plan wird wohl nur auf den Onlinedaten arbeiten. Gruß --THE IT (Diskussion) 18:22, 4. Feb. 2015 (CET)

@THE IT, ich bitte um eine Statusmeldung. lg, --De-ZD (Diskussion) 14:50, 7. Apr. 2015 (CEST)

Ich gestehe dort etwas ins Hintertreffen geraten zu sein. Der Plan besteht aber nach wie vor. --THE IT (Diskussion) 23:55, 7. Apr. 2015 (CEST)

Vorlagen einbinden??[Bearbeiten]

Guten Tach, ich hatte in der Technikwerkstatt angefragt: wäre es möglich die wikipedia Vorlagen Vorlage:PGIA; Vorlage:PGIW [5] und Vorlage:PGDA; Vorlage:PGDW [6] einzubinden, um so eine Standardisierung und Vereinfachung im Umgang mit Links zu den Gutenbergen zu bekommen. Wenn ja: wie, wenn nein, warum bzw Diskussion darüber? Nutzer THE IT wies drauf hin, dass dies technisch kein Problem sei, er bat, diese Diskussion zunächst im Skriptorium anzustoßen. UserTHE IT deutete auch auf diese Diskussion hin zu Aspekten dieses Themas. Nun denn, wie sind die Meinungen zu diesem Thema? Sein oder Nichtsein? Gruß--De-ZD (Diskussion) 10:58, 16. Feb. 2015 (CET)

Ich finde beide Projekte aus verschiedenen Richtungen her schwierig. Das Projekt-Gutenberg-DE macht sich aus meiner Sicht durch deren praktizierten Copyfraud indiskutabel. Die ältere (internationale Version) hat viele Werke, vor allem im englischsprachigen Raum, frei verfügbar. Allerding gibt es hier einige Kritikpunkte bezüglich der Editionsrichtlinien. So kann es vorkommen, dass hier Anpassungen an moderne Schreibweisen vorkommen können. --THE IT (Diskussion) 20:19, 16. Feb. 2015 (CET)
Ich wollte die Gutenberge auch nicht heiraten. Mir geht es nur darum, dass man mit einer Standardisierung mittels Vorlagen die ohnehin laufend gesetzten Links, die dem Nutzer ja einen Mehrwert bieten sollen, vereinheitlichen kann und die künftige Arbeit mit Autorenseiten so verbessern kann. Ich glaube, die links sind für die Nutzer wichtig (auch für mich) und erhöhen einfach den Komfort, wenn man nicht nochmal zusätzlich suchen muss. Die Gutenberge werden ja auch soweit ich es überblicken kann nicht als Quellennachweis (wofür sie ja auch nicht gedacht und fast ungeeignet sind) gesetzt, sondern wohl immer nur als zusätzliche Information: hier gibt es E-Texte zu diesem Autor (die man sich dann auf seinen Reader laden kann und bequem auf dem Sofa lesen). Thats all. --De-ZD (Diskussion) 21:08, 16. Feb. 2015 (CET)
Man könnte bei deiner Beharrlichkeit schon auf die Idee kommen, dass du mit Gutenberg eine Verbindung eingehen möchtest. Ich kann das beim besten Willen nicht nachvollziehen, da GB beliebige Ausgaben verwendet, keine ER, mangelhafte Metadaten und keine Seitenzahlen hat. Wieso soll denn der Leser von unserem Projekt dorthin geführt werden? Dann können wir uns doch auch die sorgfältige Auswahl sparen und verlinken künftig jeden E-Text, der sich im Netz finden lässt, das bringt mit Sicherheit auch Mehrwert. – Paulis 22:25, 23. Feb. 2015 (CET)
Man kann von Gutenberg ja halten was man will, aber es bleibt immer noch der mit Abstand größte Anbieter von E-Texten im deutschsprachigen Internet. Die meisten Leser werden sich für Seitenzahlen etc. kaum interessieren, sondern sind bereits froh, wenn sie sich die Texte mit geeigneten Tools als E-Books herunterladen können. Viele der Texte können wir bei Wikisource aus Mangel an Kräften einfach nicht anbieten (und werden wir auch in Zukunft nicht können), da wäre es zumindestens fair, wenn wir dem Leser das erweiterte Angebot nicht vorenthalten.--Sinuhe20 (Diskussion) 22:58, 23. Feb. 2015 (CET)
Fair? Verlinkt GB Wikisource? Reicht es denn nicht, wenn die Wp dorthin verlinkt? Wir wollen doch gar nicht sämtlichste Werke anbieten, uns geht es doch vielmehr um das Besondere, oder um eine Rarität. – Paulis 23:23, 23. Feb. 2015 (CET)
Hallo Paulis, mit den Gutenbergen habe ich keinerlei "Verbindung", außer dass ich mir da gerne mal Lesefutter beschaffe. Wenn ich einen Autor suche, lande ich häufig bei wikisource (auch wenn Lücken in den Autorenliste noch groß sind). Ärgerlich dann, wenn man feststellt, es werden zwar (oft lückenhaft) Digitalisate nachgewiesen, aber keine oder nicht vollständige Hinweise auf schon bestehende Texte bei anderen Portalen wie eben Gutenberg.org, GutenbergDE aber auch Zeno.org, NGIYAW, Project Sophie, Mobileread usw. gegeben. Wer einfach nur den Roman x von Autorin y sucht weil er den lesen will, der ist für die Info, dass es irgendwo da draußen diesen text kostenlos für private Nutzung schon mal gibt, sicher dankbar. Von mir aus können wir ja einen Warnhinweis in die Vorlagen machen: <ironie> "Achtung, dieser E-Text von Gutenberg genügt keinesfalls wissenschaftlichen Ansprüchen, hat keine Seitenzahlen, beruht auf einer völlig unklaren Textausgabe, wurde womöglich nicht sehr sorgfältig korrekturgelesen und hat keine mit e überschriebenen u's und a's und leider Gottes auch kein langes ſ. Wir bedauern das und wünschen trotzdem gute Unterhaltung."</ironie > Ich denke, es geht doch nur um Links, ich wollte ja keine Gutenbergschen Texte als Quelle und Textgrundlage für ein Projekt hier wählen.Mal im Ernst, wenn das Vorlagen einbinden für Gutenberge schon solche Aufwallungen verursacht, dann lassen wirs halt. Ich werde trotzdem links einstellen, wo ich das für sinnvoll halte und mir und hoffentlich allen Nutzern Mehrwert bringt, nämlich die, die einfach nur Lesen wollen, ohne wissenschaftliche Ansprüche und denen es weitgehend egal ist, ob sie die Erstausgabe oder die 6. Auflage lesen. Wenn das mit der Verlinkung (manuell oder mit Vorlage) nicht in Ordnung ist, dann sag mir das bitte jetzt. Gruß--De-ZD (Diskussion) 11:40, 24. Feb. 2015 (CET)
Hallo ihr Beiden, ich möchte an dieser Stelle einen Kompromiss vorschlagen, den De-ZD schon praktiziert. (an dieser Stelle erstmal einen Dank für die fleißige Erstellung der Autorseiten, ich bin dran das Aktualisierungsskript zu erstellen, habe aber noch technische Schwierigkeiten). Ich kann beide Argumente sehr gut nachvollziehen, auf der einen Seite steht der qualitative Anspruch unseres Projektes, der durch die Ausweisung von Digitalisaten mangelnder Qualität Probleme bekommt. Auf der anderen Seite stimmt es selbstverständlich, dass wir denjenigen verpflichtet sind, die unsere Seiten besuchen ... den Lesern ... und denen sollte man die bestmöglichsten Informationen zukommen lassen. De-ZD hat da einen guten Ansatz wie ich finde. Die Links auf qualitativ fragwürdige Seiten finden sich auf von ihm erstellten Autorseiten unter der Rubrik Weblinks, damit kann ich persönlich sehr gut leben. --THE IT (Diskussion) 13:13, 24. Feb. 2015 (CET) PS: Mir ist noch ein Gedanke gekommen. Ich selbst bin nie ein Fan davon entmündigt zu werden. Tun wir nicht genau das, wenn wir sagen: “Lieber Leser wir stellen dir diese Informationen nicht zur Verfügung, weil wir denken sie sind qualitativ nicht würdig.“. Ein Wissenschaftler der nach fundierten Textgrundlagen sucht wird schon wissen, dass es nicht die Top Idee ist diese bei Gutenberg (beide Ausgaben) zu suchen. Aber wie De-ZD sagt, der Normalleser möchte einfach nur ein E-Book, welches er auf seinen Reader packen kann, warum ihm also diesen Verweis vorenthalten? Und am Ende des Tages ist jeder Nutzer der hier erfolgreich fündig wurde ein potentieller Mitstreiter.
…und so schlecht ist die Qualität bei Gutenberg-DE wie gesagt auch nicht. Da gibt es zum einen das GaGa-Projekt, bei dem die Texte wie bei uns auf Scan-Grundlage und anhand von Korrekturrichtlinien zweimal gegengelesen werden. Zum anderen scheint es bei den meisten Werken genaue Quellenangaben zu geben, so daß man zumindest weiß, welche Texte nur per E-Mail eingesandt wurden und welche vom GaGa-Projekt kommen…--Sinuhe20 (Diskussion) 15:52, 24. Feb. 2015 (CET)
Ich kann mich weder für die Verlinkung von Gutenberg noch von Zeno besonders begeistern (und das ist zurückhaltend ausgedrückt). Ich denke, da ist qualitativ vieles im Argen. Es scheint eben nur genaue Anagben zu geben. Mehrfach schon stolperte ich über Fehler: Tippfehler, falsche Seitenzahlen ,... – wer einfach nur irgendwelches Lesefutter möchte, der ist dort gut aufgehoben, aber verlinken müssen wir das deshalb doch nicht, denn dann kann man ja gleich bei G'berg und Zeno suchen. Unsere Autorenseiten gewinnen dadurch nichts. --Flugs (Diskussion) 19:40, 25. Feb. 2015 (CET)
Hallo Flugs, sicher findet man Fehler, da sind offenbar bedauerlicherweise noch Menschen am Werk. Es geht um den Nutzen, möglichst viele verfügbare Quellen und Informationen zu den Autoren zusammenzustellen. Immerhin, diese Bemerkung sei erlaubt, wird auch zu wikipedia verlinkt. Da sind auch Fehler zu finden. Dann muss man diese Links ebenfalls weglassen. --De-ZD (Diskussion) 20:40, 25. Feb. 2015 (CET)
...und Wikisource ist auch nicht fehlerlos, ganz und garnicht. Wir verlinken auf unseren Autorenseiten sogar Werke, die nur eine Erstkorrektur haben. Und wenn man den OCR-Salat bei der Gartenlaube sieht, müsste man eigentlich schreiend davonrennen. ;-) --Sinuhe20 (Diskussion) 15:11, 26. Feb. 2015 (CET)
Wo wir bei Fählern vs Qualitätsprojekt sind: man sollte vielleicht einen Blick auf diese nach deutschem Recht nicht gemeinfreien Autoren -(seiten) werfen. Die 1945er habe ich mal weggelassen, nächstes Neujahr sind die ja frei.

  1. Mittelhaus, Karl 19. Januar 1946 deutscher Klassischer Philologe und Gymnasiallehrer
  2. Fiebiger, Otto 23. Januar 1946 deutscher Althistoriker, Epigraphiker und Bibliothekar
  3. Kalbfleisch, Karl 7. Februar 1946 deutscher Klassischer Philologe
  4. Meier, Paul Jonas 11. Februar 1946 deutscher Kunsthistoriker, Lehrer und Museumsdirektor
  5. Kießling, Max 28. März 1946 deutscher Geografiehistoriker
  6. Doublier, Othmar 29. April 1946 österreichischer Rechtshistoriker und Bibliothekar
  7. Kühnemann, Eugen 12. Mai 1946 Philosoph und Literaturwissenschaftler
  8. Hoppe, Karl 5. August 1946 deutscher Klassischer Philologe und Gymnasiallehrer
  9. Kretzschmar, Johannes 18. Februar 1947 deutscher Archivar
  10. Riess, Ernst 12. Juni 1947 deutsch-amerikanischer Klassischer Philologe
  11. Clemen, Paul 8. Juli 1947 Kunsthistoriker
  12. Cumont, Franz 20. August 1947 belgischer Archäologe, Religionshistoriker, Philologe und Epigraphiker
  13. Hiller von Gaertringen, Friedrich 25. Oktober 1947 deutscher Epigraphiker
  14. Hassert, Ernst Emil Kurt 5. November 1947 deutscher Geograf
  15. Seiffert, Max 13. April 1948 Musikwissenschaftler
  16. Trüdinger, Otto 5. Mai 1949 deutscher Finanzwissenschaftler und Statistiker
  17. Oehlke, Waldemar 14. Juli 1949 deutscher Germanist
  18. Schatz, Josef 23. März 1950 österreichischer Philologe, Professor für Germanistik
  19. Willrich, Hugo 20. Juni 1950 deutscher Althistoriker
  20. Wilhelm, Adolf 10. August 1950 österreichischer Epigraphiker und Klassischer Philologe
  21. Hennecke, Edgar 25. März 1951 deutscher Theologe
  22. Wutke, Conrad 6. April 1951 deutscher Archivar und Historiker
  23. Schmid, Wilhelm 6. November 1951 deutscher Klassischer Philologe
  24. Waser, Otto 24. Januar 1952 Schweizer Klassischer Archäologe
  25. Bruckner, Wilhelm 17. Dezember 1952 schweizer Germanist
  26. Herzog, Rudolf 11. März 1953 deutscher Altphilologe und Archäologe
  27. Züricher, Gertrud 13. August 1956 Schweizer Künstlerin und Volkskundlerin
  28. Albert, Peter Paul 27. November 1956 Stadtarchivar von Freiburg im Breisgau
  29. Feldhaus, Franz Maria 22. Mai 1957 deutscher Technikhistoriker und wissenschaftlicher Schriftsteller.
  30. Valentiner, Wilhelm Reinhold 6. September 1958 Kunsthistoriker und Museumsleiter
  31. Weixlgärtner, Arpad 2. Februar 1961 österreichischer Kunsthistoriker
  32. Komorzynski, Egon von 16. März 1963 österreichischer Musikwissenschaftler, -historiker und -kritiker
  33. Heiman, Hanns 11. Januar 1965 Verbandsfunktionär, Wirtschaftsberater und Schriftsteller
  34. Huber-Pestalozzi, Gottfried 11. Oktober 1966 Schweizer Arzt und Naturforscher
  35. Blume, Friedrich 22. November 1975 Musikwissenschaftler
  36. Gara, Józef 10. Juli 2013 Polnischer Bergmann, Dichter und Liedermacher

außerdem gibt es noch etliche Autorenseiten ohne Digitalisate und so einige Autorenseiten ohne jedes deutschsprachige Werk, nur Latein, diese gehören hier nicht her, dafür gibt es doch la.wikisource.org --De-ZD (Diskussion) 16:13, 26. Feb. 2015 (CET)

Bitte beim Thema bleiben. --THE IT (Diskussion) 19:21, 26. Feb. 2015 (CET)
Ok, stimmt, sorry. Der ganze Thread kann ohnehin in den Müll verschoben werden, weil wir in 20 Jahren immer noch die Vorlagen diskutieren und das nie was wird. --De-ZD (Diskussion) 20:02, 26. Feb. 2015 (CET)
@De-ZD Bei Hugo Willrich gibt es z.B. einige RE-Artikel, die gemeinfrei sind, weil sie keine Schöpfungshöhe haben. Es ist also nicht verkehrt, die Autorenseite anzulegen. In den USA sind außerdem alle Werke gemeinfrei, die vor 1923 veröffentlicht wurden, unabhängig davon, wann der Autor verstorben ist, weshalb es für diese bereits einige Digitalisate im Internet gibt.--Sinuhe20 (Diskussion) 20:24, 26. Feb. 2015 (CET)
Wenn wir schon Autoren einbauen, deren Taten keine Schöpfungshöhe aufweisen, wo bleibt dann die Qualität? :-) die 1923er Diskussion hatten wir schon. Die einen sagen so, die anderen so. lg--De-ZD (Diskussion) 20:50, 26. Feb. 2015 (CET)
In Wer bekommt eine Autorenseite? steht nichts von Schöpfungshöhe, USA oder 1923, jeder bastelt sich für seine Seite eine Ausrede zurecht und die Mehrheit der hiesigen Administratoren ist nicht bereit den eigenen Regeln Geltung zu verschaffen. Was passiert, wenn ein Löschantrag für eine solche Seite gestellt wird, ist bei Wikisource:Löschkandidaten#Gottfried Huber-Pestalozzi zu besichtigen und 20 Admins gucken zu. --9xl (Diskussion) 21:02, 26. Feb. 2015 (CET)
das hat mich auch gewundert. lg--De-ZD (Diskussion) 21:07, 26. Feb. 2015 (CET)
Hallo zusammmen! In der Frage der Verlinkung auf bestehende Texte bin ich bei De-ZD! Ich fände es auch sinnvoll, das zu machen, weil das einfach ein Mehr an Information darstellt und man sich ggf. einiges an Suchaufwand ersparen kann. Den obigen Vorschlag finde ich auch gut, das - wie bereits von De-ZD praktiziert - über Weblinks zu machen. Das heißt in meinen Augen nicht, etwas bezüglich der Qualitätsansprüche innerhalb von Wikisource zu relativieren. Viele Grüße, --Unendlicheweiten (Diskussion) 21:18, 26. Feb. 2015 (CET)
Ich fasse mal kurz zusammen ... Patt. Möge sich dann mal ein bisher argumentativ nicht involvierter Admin einer Entscheidung bemüßigen? --THE IT (Diskussion) 10:20, 3. Mär. 2015 (CET)

Hallo , ich möchte mal höflichst nachfragen, ob sich hier bei der Vorlagendiskussion noch was (Neues?) ergibt? Erkenntnisse? Vielleicht dann doch mal zur Entscheidung schreiten wie von User THEIT angeregt? usw Danke --De-ZD (Diskussion) 18:07, 1. Apr. 2015 (CEST)

Guten Morgen, mittlerweile sind wir im Wonnemonat Mai... Gibt es die Möglichkeit, über diese Frage abzustimmen, damit es so oder so vorangeht. Wenn ja, bitte mal so eine Abstimmung machen danke Gruß--De-ZD (Diskussion) 09:12, 6. Mai 2015 (CEST)

Abstimmung[Bearbeiten]

Pro

  • die links sind für die Nutzer wichtig (auch für mich) und erhöhen einfach den Komfort, wenn man nicht nochmal zusätzlich nach weiteren elektronisch verfügbaren Texten suchen muss. Wie von User THE IT weiter oben beschrieben: „Die Links auf qualitativ fragwürdige Seiten finden sich auf von ihm erstellten Autorseiten unter der Rubrik Weblinks, damit kann ich persönlich sehr gut leben.“ Ich bin für Einbindung von Vorlagen für Gutenberg.org, Gutenberg.de, Zeno.org in der Form, daß diese Links unter "Weblinks" in die Autorenseite eingebunden werden. Beispiele dafür Hugo Salus Juhani Aho Hermann Sudermann --De-ZD (Diskussion) 09:06, 12. Mai 2015 (CEST)
  • Bietet für die Leser definitiv einen Mehrwert. Die meisten Werke werden bei uns nie digitalisiert werden, entweder weil sie schon als Volltexte bei eben diesen Anbietern zur Verfügung stehen oder weil uns dafür einfach die Ressourcen fehlen.--Sinuhe20 (Diskussion) 22:33, 14. Mai 2015 (CEST)

Contra

  • Die genannten Projekte erfüllen keinen Mehrwert für unsere Leser, da ihre Standards in bezug auf die gewählten Textgrundlagen, Metadaten etc. keine wissenschaftlichen Arbeiten mit den Texten zulassen. --Koffeeinist (Diskussion) 22:31, 9. Mai 2015 (CEST)
1. Dein Argument unterstellt, wikisource Leser wären ausschließlich oder ganz überwiegend an wissenschaftlichem Arbeiten interessiert. Dies ist aber unbelegt und meiner Ansicht nach auch unzutreffend. Und: Wikisource ist für alle Leser da (auch die, die nur ein paar unterhaltsame Texte suchen oder nichtwissenschaftliche Infos suchen), nicht nur für Wissenschaftler. 2. Im übrigen sind doch etliche der angebotene Texte der in Rede stehenden websites sehr wohl gut dokumentiert. Das Pauschalurteil, daß die "gewählten Textgrundlagen, Metadaten etc. keine wissenschaftlichen Arbeiten mit den Texten zulassen" trifft m. E nicht zu. Bsp. ohne langes suchen Zeno Ein Wissenschaftler, der mit diesen links bzw. Infos zu E-Texten nicht umzugehen weiß und dabei Hilfe in Form von Zensur bei wikisource benötigt, sollte sich einfach einen anderen Job suchen. --De-ZD (Diskussion) 09:06, 12. Mai 2015 (CEST)
  • Tatsächlich wissen wir nichts über unsere Kundschaft. Aber gesucht wird im Internet mit google. Wer hierherkommt und sucht, glaube ich, hat eine gewisse Erwartung - dem helfen solche Links nicht. --9xl (Diskussion) 09:46, 12. Mai 2015 (CEST)
  • Bitte nicht! Kürzlich sah ich 'Wortblume' verlinkt, für mich ist das ein Unding! – Paulis 15:42, 14. Mai 2015 (CEST)
Ehrlich: Ich verstehe Deinen Einwand nicht. Wieso ist das ein Unding? Führen wir uns einmal die Fakten zu Gemüte: Folgende zwei (sind es mehr?) Autorinnen haben Links auf wortblume: Louise Aston und Kathinka Zitz-Halein. Da ich letztere bearbeitet habe, nehmen wir diese als Beleg für Unding oder Nicht-Unding. Auf der wikisource-verlinkten website lesen wir Zitat Textgrundlage »Clemence Isaure« aus: Karl Wilhelm Bindewald: Deutschlands Dichterinnen. Blüthen deutscher Frauenpoesie, aus den Werken deutscher Dichterinnen der Vergangenheit und Gegenwart [...]. Osterwieck/Harz: Zickfeldt, o. J. [ca. 1895] Die übrigen Gedichte aus: Kathinka Zitz - Tina Halein -: Wahre Freiheit: Gedichte und Prosa, herausgegeben von Dietmar Noering. Frankfurt am Main: Bangert & Metzler, 1987. Zitat Ende. Was genau ist an der Verlinkung denn nun ein "unding". Woran machts Du das fest? Dein Verhalten ist unwissenschaftlich, da Du ohne genaue Analyse ein Urteil fällst ("Unding") Und wir sind hier doch alle strengst wissenschaftlich. Habe ich lernen dürfen. Unter diesem Aspekt ist übrigens fast jeder Link auf wikisource strengwissenschaftlich gesehen strengwissenschaftlich unbrauchbar, weil niemand überprüft hat, ob ein gewisses google digitalisiertes Buch auch mit der gedruckten Textgrundlage übereinstimmt. Es könnte ja theoretisch sein, daß die Amis das Buch mit der Absicht, wikisource zu täuschen, gefälscht haben. --De-ZD (Diskussion) 09:31, 18. Mai 2015 (CEST)

BUB (Book Uploader Bot) für Google nach IA (siehe oben)[Bearbeiten]

Ist hoffentlich nur temporär deaktiviert --Historiograf (Diskussion) 02:25, 4. Apr. 2015 (CEST)

Fehlender Berabeitungs-Button[Bearbeiten]

Mir ist aufgefallen, dass der grüne Bearbeitungs-Button nicht mehr vorhanden ist. Wo isser denn hin? Ist das Problem bekannt und vielleicht Resultat eines aktuellen System-Updates? --Bodhi-Baum (Diskussion) 17:11, 5. Apr. 2015 (CEST)

Was ist mit der Vorlage IA los?[Bearbeiten]

Besser gefragt, was zur Hölle macht das IA? Seit dem Relaunch funktionieren die ersten drei Links auf

https://de.wikisource.org/wiki/Ferdinand_Wilhelm_Emil_Roth#1898

nicht mehr. Ich denke, da muss eine Menge repariert werden --FrobenChristoph (Diskussion) 00:00, 17. Apr. 2015 (CEST)

Ich habe mir das mal ganz kurz angeschaut .... man könnte die Links auf die Vollbildansicht lenken, dort kann man auch Seitenlinks verbacken. Einwände? --THE IT (Diskussion) 08:42, 20. Apr. 2015 (CEST)

Cajsa Warg[Bearbeiten]

Meine Beiträge Index:Cajsa Warg - Schwedisches Koch- und Haushaltungs-Buch.djvu und 12 transkribierte Seite war neulich gelöscht. Niemand hat versucht vor dem Löschen mir zu informieren. Ich kann nicht verstehen warum sie Zeit verschwenden am Löschanträge ohne geringsten Versuch die beeinträchtige Benutzer zu kontaktieren.

Bitte sofort rücksetzen.

Peter Isotalo (Diskussion) 22:17, 19. Apr. 2015 (CEST)

Vielleicht sollte man hier Gnade von Recht ergehen lassen und dem Werk eine 2. Chance einräumen. Ich wäre dafür. --A. Wagner (Diskussion) 22:25, 19. Apr. 2015 (CEST)
Das Kochbuch ist sicher eine spannende Sache. Du wurdest aber bereits im September darum gebeten, Dein Projekt erst hier vorzustellen. Dort findest Du auch die Voraussetzungen für neue Projekte. Dein Buch hat ja, wenn ich das richtig sehe, gegen 650 Seiten! Die Qualität Deiner ersten Probemuster ist übrigens nicht so, dass eine Erstellung als "korrigiert" gerechtfertigt wäre, da muss man sicher noch zweimal drüber. --Maasikaru (Diskussion) 00:59, 20. Apr. 2015 (CEST)
Ich habe bereits mehrere als 650 Seiten auf Schwedisch transkribieren. Es braucht normalerweise ein bisschen Zeit wenn man der einzige, der zu transkribieren sind. Ich wusste nicht das sie in Eile waren. Aber voilà.[7]
Peter Isotalo (Diskussion) 08:12, 20. Apr. 2015 (CEST)

Nominations are being accepted for 2015 Wikimedia Foundation elections[Bearbeiten]

This is a message from the 2015 Wikimedia Foundation Elections Committee. Translations are available.

Wmf logo vert pms.svg

Greetings,

I am pleased to announce that nominations are now being accepted for the 2015 Wikimedia Foundation Elections. This year the Board and the FDC Staff are looking for a diverse set of candidates from regions and projects that are traditionally under-represented on the board and in the movement as well as candidates with experience in technology, product or finance. To this end they have published letters describing what they think is needed and, recognizing that those who know the community the best are the community themselves, the election committee is accepting nominations for community members you think should run and will reach out to those nominated to provide them with information about the job and the election process.

This year, elections are being held for the following roles:

Board of Trustees
The Board of Trustees is the decision-making body that is ultimately responsible for the long term sustainability of the Foundation, so we value wide input into its selection. There are three positions being filled. More information about this role can be found at the board elections page.

Funds Dissemination Committee (FDC)
The Funds Dissemination Committee (FDC) makes recommendations about how to allocate Wikimedia movement funds to eligible entities. There are five positions being filled. More information about this role can be found at the FDC elections page.

Funds Dissemination Committee (FDC) Ombud
The FDC Ombud receives complaints and feedback about the FDC process, investigates complaints at the request of the Board of Trustees, and summarizes the investigations and feedback for the Board of Trustees on an annual basis. One position is being filled. More information about this role can be found at the FDC Ombudsperson elections page.

The candidacy submission phase lasts from 00:00 UTC April 20 to 23:59 UTC May 5 for the Board and from 00:00 UTCApril 20 to 23:59 UTC April 30 for the FDC and FDC Ombudsperson. This year, we are accepting both self-nominations and nominations of others. More information on this election and the nomination process can be found on the 2015 Wikimedia elections page on Meta-Wiki.

Please feel free to post a note about the election on your project's village pump. Any questions related to the election can be posted on the talk page on Meta, or sent to the election committee's mailing list, board-elections -at- wikimedia.org

On behalf of the Elections Committee,
-Gregory Varnum (User:Varnent)
Coordinator, 2015 Wikimedia Foundation Elections Committee

Posted by the MediaWiki message delivery on behalf of the 2015 Wikimedia Foundation Elections Committee, 05:03, 21 April 2015 (UTC) • TranslateGet help

Bessere OCR-Software[Bearbeiten]

Hallo zusammen, ich habe festgestellt, dass einige Korrekturleser als Ausgangspunkt OCR-Software verwenden, die sehr unzureichende Ergebnisse erzeugt insbesondere wenn es sich um Fraktur handelt. Dies liegt hauptsächlich daran, dass freie OCR-Software verwendet wird. Ich frage mich, ob es in Anbetracht der Unmengen an Projekten, die noch zu bearbeiten sind, nicht sinnvoll wäre die Wikimedia zur Förderung einer besser OCR-Software (ich denke da an ABBYY) zu bewegen. Möglicherweise ist sogar ABBYY bereit einige freie Seiten als Sponsoring zur Verfügung zu stellen. Dies könnte die Arbeit der Korrekturleser wesentlich erleichtern. --Arnd 22:09, 28. Apr. 2015 (CEST)

Da ich schon lange mit ABBYY arbeite, möchte ich doch Wasser in den Wein schütten. Fraktur ist nicht Fraktur (vgl. https://upload.wikimedia.org/wikipedia/commons/5/56/Oberamt_Reutlingen_003.jpg | https://upload.wikimedia.org/wikipedia/commons/5/56/OAB_Horb_001.png | https://upload.wikimedia.org/wikipedia/commons/5/52/OberamtEllwangen_001.jpg ). So mussten wir stets ABBYY erst einmal auf den "neuen Dialekt" umpolen, um brauchbare Ergebnisse zu bekommen. Und wie man aus dem erstgenannten Scan ersieht, ist halt so kurz nach den Napoleonischen Kriegen eben die Druckerschwärze rar geworden und die Bleibuchstaben ziemlich verschlissen. Da hilft dann die beste OCR nicht mehr viel. Es hat mich dann doch immer wieder überrascht, wie beispielsweise Benutzer:9xl trotzdem sehr brauchbare Roh-OCR zustande gebracht hat, mit allerdings wohl starker Nachhilfe per automatischem Ausmerzen der gängigsten Übertragungsfehler. Es mag ja verwegen sein, aber vielleicht sieht sich der Eine oder Andere, der mit diesem Werkzeug umzugehen weiß, geneigt, in Einzelfällen Entwicklungshilfe zu leisten. --Pfaerrich (Diskussion) 10:22, 29. Apr. 2015 (CEST)
Ich kann Pfaerrich nur beipflichten, die Roh-OCR des ABBYY halte ich für kaum besser als Tesseract. Der eigentliche Knüller bei ABBYY ist dass eine Beziehung zwischen Bild und Text besteht, d. h. es gibt zwei synchrone Cursor in Bild und Text was die Korrekturarbeit erheblich erleichtert und beschleunigt - aber natürlich nur so lange man sich in dem Programm bewegt. (Bei den Oberamtsbeschreibungen spielte noch die Unterstützung von Tabellen eine große Rolle, dürfte aber allgemein weniger interessant sein.) Wenn der Text aber einmal exportiert und in WS eingefügt ist, ist diese Verbindung aufgelöst. Das betrifft die käufliche und erschwingliche Version des ABBYY, wo ja Fraktur trainiert werden muss. Vielleicht gibt es andere? --9xl (Diskussion) 11:10, 29. Apr. 2015 (CEST)
Ich kann nur von meinen Erfahrungen aus der Gartenlaube und jetzt auch bei Der Todesgang des armenischen Volkes sagen, dass die Ergebnisse meist gut bis sehr gut sind. Sicher gibt es einige Fälle, wo es nicht so klappt. Allerdings habe ich für die Erkennung immer die Online OCR von ABBYY benutzt, welche immer die aktuellsten Erkennungsalgorithmen verwendet. Hier einmal die OCR von einem der oben genannten Problemfälle: http://espenfeld.de/uploads/Oberamt_Reutlingen_003.odt. Es gibt generell Probleme mit Zahlen und Sonderzeichen, aber der Rest ist ziemlich gut. Findet ihr nicht? --Arnd 13:04, 29. Apr. 2015 (CEST)
Das ist die beste Fraktur-OCR die ich bisher gesehen habe. Ich persönlich würde allerdings eine solche Cloud-Anwendung niemals benutzen. --9xl (Diskussion) 10:10, 30. Apr. 2015 (CEST)
Das ist es ja, was ich meine. Wenn wir mit OCRs dieser Qualität starten würden, haben wir mehr Zeit für andere Dinge. Ich sehe Cloud-Anwendungen generell auch kritisch. Allerdings handelt es sich ja nicht um vertrauliche Daten, sondern sogar Public Domain. --Arnd 11:53, 30. Apr. 2015 (CEST)

Auch wenn die ein oder andere Kritik kam, würde ich doch gern einen Versuch starten, eine Förderung für ABBYY Finereader Online zu bekommen. Das ganze würde ich über Software-Stipendien beantragen. Die Argumentation würde sich auf die wesentlich bessere Qualität vor allem bei Fraktur und die erhöhte Effizienz stützen, die insbesondere bei einem kleinen Projekt wie Wikisource wichtig ist. Konkret würde ich das größte Paket mit 12000 Seiten (gültig für ein Jahr) für 100€ vorschlagen unter der Annahme, dass OCRs nicht nur für mich erstellt werden sondern auch für andere Korrekturleser in WS. Hinsichtlich der Implementierung dachte ich mir folgendes: Es gibt eine Unterseite, wo OCR-Wünsche eingetragen werden können. Diese würde ich dann erst evaluieren (überprüfen ob eine gute OCR herauskommt) und dann bearbeiten. Je nach Wunsch kann ich dann die Ergebnisse direkt einfügen (evtl. per Bot) oder als Download bereitstellen. Bzgl. Transparanz werde ich nach jedem Auftrag die verbleibende Seitenzahl auf der Wikiseite dokumentieren. Da Wikimedia selbst die Zugangsdaten besitzen wird, kann immer überprüft werden, dass kein Missbrauch stattfindet. Was denkt ihr? --Arnd 11:47, 4. Mai 2015 (CEST)

Generell eine sehr gute Idee, die ich voll unterstütze. Gerade im Bereich RE, wo ich derzeit meine Nische gefunden habe, wäre es fantastisch, die bisher im IA verfügbaren Bände komplett OCR-lesen zu lassen, um sie in öffentlich nicht ohne weiteres zugänglichen Portalen für die weitere Bearbeitung/Nutzung zwischenzuparken. Dies würde dann die Suche nach bestimmten Personen oder innerhalb von langen Abhandlungen deutlich erleichtern und bei der Erstellung von Einzelartikeln die grobe Vorlage bilden können.
Dass die OCR bei Griechisch-Texten scheitern wird, nehme ich mal an. Auch wird das Ergebnis bei vierspaltigen Seitenvorlagen teilweise nicht korrekt abgegrenzt, sondern spaltenübergreifend sein, so zumindest bei bisheriger ABBYY-Anwendung.
Die von mir mehrfach als "Steinbrüche" bezeichneten Textwüsten können natürlich dann permanent durch gezielte Nachbearbeitungen aufgebessert werden, aber das ist dann eine andere Baustelle.--Pfaerrich (Diskussion) 14:40, 4. Mai 2015 (CEST)
Ich bin auch sehr dafür. Hatte die Idee auch schon einmal, da wusste ich aber noch nichts von "Software-Stipendien". Viele Grüße --Konrad Stein (Diskussion) 09:17, 5. Mai 2015 (CEST)
Selbst hatte ich zwar noch nicht mit OCR-Textübertragungen zu tun, wollte aber in naher Zukunft auch mal selbst vorsichtig damit starten. Generell befürworte ich den Vorschlag unbedingt!! 100 € für 12.000 Seiten scheinen mir ausgesprochen lohnend zu sein! Insbesondere, wenn man bedenkt, dass die zeitlichen Ressourcen der wenigen aktiven Mitarbeiter hier insgesamt doch sehr beschränkt sind! Viele Grüße, --Unendlicheweiten (Diskussion) 23:38, 4. Mai 2015 (CEST)

Danke für das Feedback. Ich werde die nächsten Tage den Antrag schreiben. Über den Stand halte ich euch dann hier auf dem Laufenden. --Arnd 14:30, 5. Mai 2015 (CEST)

Ich habe den Antrag gestellt. Mal sehen, was daraus wird. Gruß, --Arnd 11:22, 12. Mai 2015 (CEST)
Der Antrag wurde genehmigt. Wir haben als Community also 12000 Seiten, die wir per Abbyy erkennen lasse können. Was wäre eine passende Seite für die OCR-Wünsche? Eine Unterseite von Wikisource:OCR? --Arnd 22:38, 15. Mai 2015 (CEST)
Danke sehr. Als einen Test würde ich RE Bd. II,1, 961–970 vorschlagen. Davon haben wir relativ gute jpgs vom Originaldruck im IA. Essentiell für die RE ist die Spaltenerkennung, das wird durch die Zeilenzahlen in der Mitte erschwert. (Diese Zeilenzahlen selbst brauchen wir nicht.) Der Test soll auch zeigen, ob die Qualität der jpegs genügend ist, oder etwa 300dpi in voller Qu. (tiff, png) nötig ist. (Unterseite von Ws:OCR ist für mich gute Idee.) --S8w4 (Diskussion) 02:40, 16. Mai 2015 (CEST)
Hier die Test-OCRs.

Hallo zusammen, ich habe als Startseite für die ABBYY-OCR diese Seite angelegt: Wikisource:OCR/Abbyy. Dort gibt es ein paar Infos, welche ich nach und nach ergänzen werde. Auch muss ich sehen, wie der geeignet effektive Ablauf zur OCR-Erstellung aussieht. Zur Zeit habe ich nämlich z. B. noch keinen Bot, der die erstellten OCRs einspielt. Wie dem auch sei: ich hoffe, dass wir die 12.000 Seiten sinnvoll für unsere Projekte in WS nutzen. Gruß, --Arnd 13:19, 16. Mai 2015 (CEST)

Danke, Arnd, für Dein Engagement in dieser Sache! Finde ich echt klasse! Und es ist sehr erfreulich, dass Deine Bemühungen um das Software-Stipendium so schnell Erfolg hatten! Ich hoffe, Du findest bald eine Lösung, wie Du das mit Botunterstützung gut bewältigen kannst! Voraussichtlich werde ich das Angebot auch schon bald in Anspruch nehmen (zunächst wohl erst einmal mit ein paar wenigen Seiten)! Viele Grüße, --Unendlicheweiten (Diskussion) 22:41, 16. Mai 2015 (CEST)

Wikimedia Highlights, Februar 2015[Bearbeiten]

Hier sind die Highlights aus dem Wikimedia-Blog im Februar 2015, über ausgewählte Aktionen der Wikimedia Foundation und andere wichtige Ereignisse aus der Wikimedia-Bewegung.
Wikimedia Foundation RGB logo with text.svg
Help is welcome for translating the March 2015 Wikimedia Highlights, too.
About · Subscribe · Distributed via MassMessage (wrong page? Correct it here), 04:53, 4. Mai 2015 (CEST)

Wikimedia Foundation Funds Dissemination Committee elections 2015[Bearbeiten]

Wikimedia Foundation RGB logo with text.svg

This is a message from the 2015 Wikimedia Foundation Elections Committee. Translations are available.

Voting has begun for eligible voters in the 2015 elections for the Funds Dissemination Committee (FDC) and FDC Ombudsperson. Questions and discussion with the candidates for the Funds Dissemination Committee (FDC) and FDC Ombudsperson will continue during the voting. Nominations for the Board of Trustees will be accepted until 23:59 UTC May 5.

The Funds Dissemination Committee (FDC) makes recommendations about how to allocate Wikimedia movement funds to eligible entities. There are five positions on the committee being filled.

The FDC Ombudsperson receives complaints and feedback about the FDC process, investigates complaints at the request of the Board of Trustees, and summarizes the investigations and feedback for the Board of Trustees on an annual basis. One position is being filled.

The voting phase lasts from 00:00 UTC May 3 to 23:59 UTC May 10. Click here to vote. Questions and discussion with the candidates will continue during that time. Click here to ask the FDC candidates a question. Click here to ask the FDC Ombudsperson candidates a question. More information on the candidates and the elections can be found on the 2015 FDC election page, the 2015 FDC Ombudsperson election page, and the 2015 Board election page on Meta-Wiki.

On behalf of the Elections Committee,
-Gregory Varnum (User:Varnent)
Volunteer Coordinator, 2015 Wikimedia Foundation Elections Committee

Posted by the MediaWiki message delivery 03:45, 4 May 2015 (UTC) • TranslateGet help

Unglaublich[Bearbeiten]

http://archiv.twoday.net/stories/1022427216/ Kann denen mal jemand zeigen, wie man eine Navi auf Commons baut? --FrobenChristoph (Diskussion) 00:11, 5. Mai 2015 (CEST)

New Wikipedia Library Accounts Available Now (May 2015)[Bearbeiten]

Apologies for writing in English, please help translate this into your local language. Hello Wikimedians!

The TWL OWL says sign up today!

Today The Wikipedia Library announces signups for more free, full-access accounts to published research as part of our Publisher Donation Program. You can sign up for new accounts and research materials from:

  • MIT Press Journals — scholarly journals in the humanities, sciences, and social sciences (200 accounts)
  • Loeb Classical Library — Harvard University Press versions of Classical Greek and Latin literature with commentary and annotation (25 accounts)
  • RIPM — music periodicals published between 1760 and 1966 (20 accounts)
  • Sage Stats — social science data for geographies within the United States (10 accounts)
  • HeinOnline — an extensive legal research database, including 2000 law-related journals as well as international legal history materials (25 accounts)

Many other partnerships with accounts available are listed on our partners page, including Project MUSE, JSTOR, DeGruyter, Newspapers.com and British Newspaper Archive. Do better research and help expand the use of high quality references across Wikipedia projects: sign up today!
--The Wikipedia Library Team 00:12, 5. Mai 2015 (CEST)

We need your help! Help coordinate Wikipedia Library's account distribution and global development! Please join our team at Global our new coordinator signup.
This message was delivered via the Mass Message tool to The Wikipedia Library Global Delivery List

Vorlage:GBS[Bearbeiten]

Hallo, habe soeben erst bemerkt, dass die Vorlage auf google.com verweist. Während man bei

Ist dies ein bekanntes Problem? Wenn nicht, wie könnte damit umgegangen werden? --Mapmarks (Diskussion) 23:01, 5. Mai 2015 (CEST)

    • Google Probleme sind bekannt, habe ich schon paarmal gesehen, daß .de geht und .com nicht. Eine Lösung dafür gibt es nicht. Du kannst jetzt in deiner Aufstellung o.ä den Link direkt angeben Google.de-Link-von-meinem-schönen-Buch oder lad' es doch gleich, wenn gemeinfrei, ins Archive hoch. Habe ich mal für dieses Buch gemacht Internet Archive sollte irgendwann im Laufe der nächsten Stunden gehen, wenn die Queue abgearbeitet ist vom BUB (Book Uploader Bot) lg --De-ZD (Diskussion) 08:58, 6. Mai 2015 (CEST)
Ich habe so ca. 50 Links probiert, books.google.com geht nie, books.google.de/.at/.ch funktioniert. D. h. wir haben 128.000 tote Links.
Wäre es jetzt nicht eine lohnende Aufgabe für die Listen-Junkies, herauszufinden welche Links nach einer generellen Umstellung der Vorlage auf books.google.de wieder funktionieren und die nicht funktionierenden abzuändern oder zu eliminieren? --9xl (Diskussion) 09:54, 6. Mai 2015 (CEST)
Hammerhart, eben erst gemerkt, die gemeinfreien google.com Adressen (die, vor ca. 1873 ohne "US") gehen nicht mehr! Aber es funzt (wie lange noch?) über proxy also wie bei den "nach ca. 1873"-Werken. Zum Kotzen. --De-ZD (Diskussion) 10:16, 6. Mai 2015 (CEST)
Da scheinen ja gerade mächtige Umwälzungen im Gang zu sein. Gibt es dazu verlässliche Informationen? --Konrad Stein (Diskussion) 14:42, 6. Mai 2015 (CEST)

Die Vorlage GBS sollte so schnell wie möglich so angepaßt werden: Google-US für proxy bleibt, google ohne US muß die Adresse auf google.de geändert werden. Wegen der de-wikisource-weiten Auswirkungen soll das mal ein Fachmann machen, sonst hätt ich das geändert ... ;-) Kann sich da bitte jemand mal kümmern? lg--De-ZD (Diskussion) 09:52, 7. Mai 2015 (CEST)

habe .com durch .de ersetzt, [8]. Teilweise funkioniert es: (Beispiel Friedrich List) , teilweise nicht: (Beispiel Isabella Braun). Warum? --A. Wagner (Diskussion) 12:13, 7. Mai 2015 (CEST)
Manchmal hilft einfach nur warten. :) --A. Wagner (Diskussion) 14:46, 7. Mai 2015 (CEST)

Vorlage:Zeitschrift[Bearbeiten]

Dank unseres Vorlagenbaumeisters The IT haben wir seit neuesten die Vorlage:Zeitschrift, die dem bisherigen notgedrungenen Mißbrauch der Listen- oder Textvorlagen abhilft. Bitte fleißig verwenden und nachrüsten.
Wir verfügen nun also über folgende großen vier (etwas vergessen?) Seitenkennzeichnungsvorlagen:

Mein Vorschlag wäre auch den Autoren- und Textboxen eine je eigene Farbe zu verleihen.
Noch eine Frage zu den Zeitschriften: hat es Sinn ein Feld für ISSN einzuschrauben? Einzelne historische Zeitschriften haben eine ISSN, andere nicht. Kann jemand abschätzen ob sich das lohnt?
Da ja derzeit auch große Mengen an GNDs für Werke verliehen werden – ist es Sinnvoll ein GND-Feld in der Textbox zu verankern?
Mit vielen Grüßen von --Konrad Stein (Diskussion) 14:39, 6. Mai 2015 (CEST)

Der Vorschlag verschiedene Farben zur Unterscheidung der Art der Seite zu verwenden gefällt mir. Es gibt noch weitere, nämlich die Vorlagen (derzeit alle mit blauem Kopf):
--Mapmarks (Diskussion) 22:27, 15. Mai 2015 (CEST)

Auskenner WP, C, WS, WD gesucht[Bearbeiten]

Am 27. August 2015 bietet die Archivberatung des Landschaftsverbandes Rheinland eine Fortbildungsveranstaltung für rheinische Archive an. Uns wurde der ganze Nachmittag angeboten, um die Wikipedia, Wikimedia Commons, Wikisource und Wikidata vorzustellen und damit die Möglichkeiten der Zusammenarbeit mit Archiven auszuloten. Das Tagungsprogramm findet ihr online.

Der Kurier-Reporter sucht nun bis zu drei Mitstreiter/innen, die an diesem Tag Zeit und Lust haben, Wikipedia, Wikimedia Commons, Wikisource und Wikidata vorzustellen. Geplant ist ein Einführungsvortrag durch den Reporter und im Anschluss ein Projekt-Kennenlernen in kleinen Gruppen à la „Weltcafe“, „Cross table“ oder „Speed dating“ (bitte den jeweils persönlich favorisierten Begriff lesen). Interessenten können sich gerne auf der Diskussionsseite des Reporters melden. Reisekostenübernahme erfolgt durch WMDE und/oder den LVR (muss noch konkret abgesprochen werden).

Zustandegekommen ist die Veranstaltung am Rande der WikiCon 2014, auf der es ein erstes Treffen zwischen der LVR-Archivberatung, Barbara Fischer von WMDE und dem Reporter gab. (ray, 7.5.)

Ende meiner Admintätigkeit[Bearbeiten]

Ich habe vor einigen Tagen meinen Adminstatus abgegeben und wurde daraufhin per E-mail gebeten, etwas über die Gründe zu sagen. Das will ich hier öffentlich tun.

Es ist wie so oft, es gibt viele Gründe und einen Auslöser. Ein Grund ist mein schon länger gehegter Wunsch, nach Abschluss der Oberamtsbeschreibungen mein Engagement hier zurückzufahren. Auch private Gründe lassen mir jetzt weniger Zeit für WS. Ein weiterer Grund ist meine wachsende Unzufriedenheit mit dem Verhalten meiner Adminkollegen.

  1. Als Dienstleister für die Gemeinschaft habe ich ein Dutzend Seiten gelöscht. Dazu gab es einen Löschantrag und drei Stimmen für Löschen ohne Gegenstimmen. Zwei meiner ehemaligen Adminkollegen haben diese Seiten wiederhergestellt und brauchten dafür keinen Auftrag der Gemeinschaft. Mein Verständnis der Adminfunktion war eine andere, da möchte ich nicht Mitglied sein.
  2. Da hat uns Jemand eine Liste mit Regelverstößen um die Ohren gehauen und 20 Admins gucken zu. Nach meinem Verständnis sollte ein Admin (u. a.) dafür sorgen dass die Regeln der Gemeinschaft eingehalten werden. Wer die Regelungen nicht gut findet, sollte versuchen sie zu verbessern anstatt die Regeln zu ignorieren oder gar zu unterlaufen.
  3. (Hat nichts mit Admins zu tun.) Das klägliche Scheitern meines Projektantrags. Ich habe schon viel Zeit darein investiert und ich kriege das ans Netz, auch wenn das noch mehr Zeit und Mühe kosten wird.

Sucht euch einen Trigger aus. --9xl (Diskussion) 18:27, 8. Mai 2015 (CEST)

Das ist sehr bedauerlich. Ich hoffe, Du bleibst aktiv. lg--De-ZD (Diskussion) 21:25, 8. Mai 2015 (CEST)
Hallo 9xl, ich bedauere Deinen Schritt ebenfalls sehr! Die Zahl der sehr engagierten Mitstreiter hier ist überschaubar. Du wirst als Admin eine Lücke hinterlassen!
  1. Deinen Ärger in dieser Sache verstehe ich. Das ist nicht gut gelaufen!
  2. Bei der Sache mit den Regeln: vollste Zustimmung!
  3. Dass Du auf Deine Projektanfrage kein Feedback bekommen hast, finde ich bedauerlich! Scheitern würde ich es aber nicht nennen. Wenn ich mal von mir ausgehe: es gibt hier noch einige andere Projekte, an denen ich stärkeres Interesse habe. Hier gibt es ja noch so viele offene Baustellen ... Und leider kann ich nur relativ wenig Zeit hier investieren. Und dennoch: ein paar Seiten Zweitkorrektur hin und wieder könnte ich sicher auch beisteuern. (Was aber einer kurzfristigen Fertigstellung sicherlich auch nicht entscheidend voranhilft).
Auch ich hoffe, dass Du weiterhin hier aktiv mithilfst! Viele Grüße, --Unendlicheweiten (Diskussion) 15:09, 9. Mai 2015 (CEST)
ich bedaure es ebenfalls sehr, dass Du Dich genötigt sahst, diesen Schritt zu tun. In der Tat ist in der Admin-arbeit der Wurm drin, sie ist abgesehen von den bots-Tätigkeiten unstrukturiert und letztlich undokumentiert, d. h. es fehlt an einer Handreichung, was alles zu erledigen ist und welche Hilfsmittel dem Admin hierfür zur Verfügung stehen, sowie eine gewisse Absprache, wer sich für welches Thema einspannen lässt. Keiner kann für Alles die Kindsmagd sein, und gelegentliche bissige Bemerkungen motivieren nicht unbedingt, sich in Dinge einzumischen, wo weitere despektierliche Kommentare zu gewärtigen sind.
Was die Raiß angeht, geb ich zu, sie schlicht übersehen zu haben. Nimm bitte zur Kenntnis, dass ich als Korrektor voll zur Verfügung stehe, schon allein als Gegenleistung für die OABs, aber auch aus eigener Zuneigung zum Thema. Ich schlage vor, den archivierten Beitrag zurückzuholen, dann kommt auch mein Siegel drauf. Pfaerrich (Diskussion) 19:59, 9. Mai 2015 (CEST)
Ich kann mich meinen Vorrednern nur anschließen. Vor allen den Aspekt, dass häufig sich kein Administrator findet eine eindeutige Entscheidung zu fällen. Den Frust über das schwedische Kochbuch von 9xl kann ich sehr gut verstehen, da er in Rahmen der Regeln gehandelt hat, die wir hier vorsehen. Da sollte es möglich sein, die Diskussion so zu führen, dass seine Entscheidung nicht einfach revidiert wird, denn das führt dazu, dass keiner mehr Entscheidungen treffen will.
Ich möchte daher an dieser Stelle einen Vorschlag unterbreiten. Die Admintätigkeit sollte hier einen etwas geregelteren Rahmen bekommen. Ich könnte mir hier eine Unterseite Wikisource:Administratoren/Aufgaben vorstellen. Hier könnten wir die Bürden auflisten, die Admins zu tragen haben und die Aufgaben entsprechend verteilen, damit sich nicht Alle um alles kümmern müssen. Dabei sollten natürlich der entsprechende Backround, sprich Wissensexpertise, berücksichtigt werden. Dies schafft dann vor allem eine Plattform, solche Streitfälle, wie oben, zu diskutieren. --THE IT (Diskussion) 08:45, 11. Mai 2015 (CEST)
Ich würde mich auch freuen, wenn du weiterhin aktiv bist. Wir brauchen erfahrene Mitarbeiter. Die angesprochene Liste hab ich unten auseinandergedröselt. Eine eindeutige Definition der Aufgaben ist wichtig, dann kann nichts liegen bleiben. --Koffeeinist (Diskussion) 16:11, 11. Mai 2015 (CEST)
Wenn ich schon so auf den Deckel bekomme, möchte ich mich doch auch nochmal kurz zu Wort melden: Etwas zerknirscht muss ich natürlich zugeben, dass die Kritik sachlich berechtigt ist. Ich habe Einzelseiten des Kochbuches ohne Rücksprache mit der Community wiederhergestellt, nachdem der Index aus dem Löschnamensraum geholt wurde. Mea culpa. Ich könnte jetzt sicherlich einige Gründe zur Verteidigung anführen und hätte da auch noch den ein oder anderen (für mein Empfinden) Mißstand anzumelden, habe dazu aber jetzt wirklich nicht die Nerven. Nicht aus Trotz oder Reaktion, sondern schlicht und einfach aus Zeitmangel (und der damit verbundenen Vernachlässigung der Aufgaben) und um vielleicht einen Neuanfang zu ermöglichen, werde ich mein Amt ebenfalls zurückgeben. --Starshollow (Diskussion) 21:54, 11. Mai 2015 (CEST)
Also echt, die Diskussionen und Entscheidungen zu den Löschkandidaten nerven mich genauso. Da wird auf behalten plädiert, ohne ein Rettungskonzept vorzulegen. Und wenn dann wirklich mal was gelöscht wird, und es gibt Gezeter, dann gibt es doch wieder Gutmenschen die das Werk ganz selbstlos wiederherstellen. Auch ein schönes Bespiel: Orbis sensualium pictus, es passiert außer Schaumschlagen nix. Diskussionsbeiträge noch und nöcher, die Energie dafür hätte prima ins Werk gesteckt werden. Meine Güte, wir haben doch nicht ohne Grund Regeln gemacht. Das nun gleich zwei gute Admins ihre Rechte abgeben, ist mehr als bedauerlich, weil beide hier einen guten Job gemacht haben. – Paulis 19:05, 13. Mai 2015 (CEST) P.S. Ich glaube wir sollten eine Meckerseite einrichten, wo auf Missstände aufmerksam gemacht wird?

Wikimedia Highlights, März 2015[Bearbeiten]

Hier sind die Highlights aus dem Wikimedia-Blog im März 2015.
Wikimedia Foundation RGB logo with text.svg
About · Subscribe · Distributed via MassMessage (wrong page? Correct it here), 04:35, 9. Mai 2015 (CEST)

OTRS-Vorlage[Bearbeiten]

Hallo, ich möchte vorschlagen, die OTRS-Vorlage von Commons zu importieren. Und bei der Gelegenheit gleich eine Wartungskategorie für die frei lizensierten Werke anzulegen. Einziges Werk, das mir dazu einfällt ist Zbiór wierszy o wilamowskich obrzędach i obyczajach oraz Słownik języka wilamowskiego --Koffeeinist (Diskussion) 21:34, 9. Mai 2015 (CEST)

Kann ich dir gerne machen ... würde ich aber abspecken. Wir brauchen nicht die Kompatibilität zu diversen möglichen Eingangsparameter (einfach sagen, was du da haben möchtest) und es werden auch nicht automatische Erkennung diverser Sprachen verlangt. Einverstanden?
Gruß --THE IT (Diskussion) 08:31, 11. Mai 2015 (CEST)
Da hast du den Überblick. Mir reicht es völlig, wenn der OTRS-Hinweis nicht so unprofessionell wie hier in der Textbox aussieht. Danke, --Koffeeinist (Diskussion) 15:51, 11. Mai 2015 (CEST)
Dann werde ich mal diese Vorlage hier klauen. Soll es auch ein seitenbreites Banner werden, oder soll es was für die Textbox werden? --THE IT (Diskussion) 17:16, 11. Mai 2015 (CEST)
An die hatte ich gedacht. Es sollte von der Breite her in die Textbox passen. --Koffeeinist (Diskussion) 17:48, 11. Mai 2015 (CEST)

In Arbeit. --THE IT (Diskussion) 17:54, 11. Mai 2015 (CEST)

Autorenseiten[Bearbeiten]

Hallo!

9xl hat völlig zu Recht auf die Liste nicht-gemeinfreier Autoren hingewiesen. Ich habe diese Diskussion ehrlich gesagt nicht mitbekommen, aber wir sollten die Regeln zur Anlage von Autorenseiten klarstellen.

Derzeitiger Stand:

  1. Der Autor ist gemeinfrei, d.h. mindestens 70 Jahre tot.
  2. Der Autor wird nächstes Jahr gemeinfrei, d.h. er ist 69 Jahre tot. Vergleiche dazu die Einträge in der Kategorie Wikisource:Gemeinfreiheit 2016.
  3. ADB-Mitarbeiter können unabhängig vom Todesjahr eine Autorenseite bekommen. Das trifft auf folgende Autoren zu:
  • Personen, die selbst nichts geschrieben haben, können Personenseiten erhalten. Die dort gelistete Literatur muss gemeinfrei sein.

Nach der Liste sollte zwei Ausnahmen ergänzt werden:

Der Jurist würde sagen, dass wir hier eine planwidrige Lücke im Regelwerk haben. Wir lassen die Erfassung der Texte zu, verbieten aber bislang die Anlage der Autorenseiten. Wir sollten WS:Urheberrecht aktualisieren. Die Regelung wird denn betreffenden Werken vorangestellt: „[WS: Obwohl der Verfasser des Artikels noch nicht über 70 Jahre verstorben ist († 1947), ist der Artikel gemeinfrei, da er keine Schöpfungshöhe aufweist. Näheres dazu unter w:Schöpfungshöhe. Bist du anderer Meinung, nutze bitte die Diskussionsseite dieses Artikels.]“

Folgende Autoren wurden als Herausgeber eines gemeinfreien Werkes erfasst. Hier könnten wir eine Ausnahme festlegen.

Nach derzeitigem Stand wären folgende Seiten zu löschen:

  1. Hanns Heiman
  2. Wilhelm Reinhold Valentiner
  3. Rudolf Herzog (Altphilologe)
  4. Edgar Hennecke
  5. Waldemar Oehlke
  6. Karl Mittelhaus
  7. Otto Fiebiger
  8. Karl Kalbfleisch
  9. Paul Jonas Meier
  10. Eugen Kühnemann
  11. Karl Hoppe (Philologe)

Bereits gelöscht wurde die Seite Gottfried Huber-Pestalozzi

Die im oben genannten Abschnitt ebenfalls angesprochene Problematik der Autorenseiten ohne Digitalisate ist mit der Anlage einer entsprechenden Wartungskategorie (Digitalisate gewünscht) erledigt. Auch das Problem der Autorenseiten mit ausschließlich fremdsprachigen Titeln wurde bereits ausführlich diskutiert, Ergebnis war, den status quo beizubehalten. Siehe: Wikisource_Diskussion:Löschkandidaten#Überführung fremdsprachiger Werke von de-Autorenseiten auf die Seiten der entsprechenden Sprachwikis

--Koffeeinist (Diskussion) 22:05, 9. Mai 2015 (CEST)

So lösche er! --THE IT (Diskussion) 08:36, 11. Mai 2015 (CEST)
Ich warte noch bis morgen auf Äußerungen dazu. Dann werde ich die elf regelwidrigen Seiten löschen. --Koffeeinist (Diskussion) 16:04, 11. Mai 2015 (CEST)
PS: Anregung ... zur allgemeinen Admintätigkeit lasse ich weiter oben noch ein wenig was fallen. ... aber hierzu vielleicht ein Gedanke. Eine gelöschte Seite ist ja nicht unwiderruflich weg. Ich könnte mir eine Seite Wikisource:Administratoren/Aufgaben/Wiedervorlage Gemeinfreiheit vorstellen auf der solche Seiten vermerkt werden und mit dem Datum versehen werden an dem sie wieder hergestellt werden können. Bei einem Großteil der erwähnten Seiten wäre das dann der 1.1.2017.
Das ist eine gute Idee, schließlich steckt Arbeit in diesen Seiten, und die sollte nicht verloren gehen. --Koffeeinist (Diskussion) 17:08, 11. Mai 2015 (CEST)
Ja, vielleicht nicht so auf 'Wiedervorlage Gemeinfreiheit' beschränkt. Da könnte auch gespeichert werden, was aus anderen Gründen (z. B. Inaktivität) gelöscht wurde aber durchaus wiederbelebt werden könnte. --9xl (Diskussion) 10:06, 12. Mai 2015 (CEST)
Ehrlich gesagt könnte ich mit Autorenseiten die Verweise auf irgendwo freie Digitalisate enthalten, sehr gut leben (und laut Regelwerk sind ja Ausnahmen sowieso möglich :-) ... Auf jeden fall, die 1946 geborene für ein halbes Jahr zu löschen, ist Doppelarbeit. S8w4 (Diskussion) 16:10, 12. Mai 2015 (CEST)
Aber das ist ja gerade das Dilemma, welches uns hierher geführt hat, dass unsere Regeln so fusselig sind, dass jeder sie so auslegen kann, wie er gerne möchte und das schafft halt keine verlässliche Grundlage für Admins, denen dann jeder Willkür vorgeworfen wird. --THE IT (Diskussion) 16:57, 12. Mai 2015 (CEST)
Also viel Arbeit ist es ja nicht. Versteh mich nicht falsch: Ich bin dafür, das Urheberrecht möglichst weit auszulegen und alle legalen Ausnahmen zu nutzen. Das tun wir ja schon. Aber sobald der Urheberrechtsschutz greift, müssen wir das respektieren. --Koffeeinist (Diskussion) 17:13, 12. Mai 2015 (CEST)
Wo verletzen wir denn das Urheberrecht? Ich bin kein Jurist, aber nach meinem Verständnis macht man sich nicht strafbar, wenn man auf das Angebot eines Dritten verweist. Wenn bei Google Books oder im Internet Archive oder bei Gallica Digitalisate von Werken liegen, die nach deutschem Urheberrecht noch geschützt sind, dann dürfen wir diese Werke selbstverständlich nicht hier auf Wikisource transkribieren. Aber wir dürfen doch wohl auf Themen- und Autorenseiten darauf verlinken! Darin besteht für mich ein großer Nutzen von Wikisource, gerade auch in meiner wissenschaftlichen Arbeit, weil ich hier alle möglichen digital verfügbaren Werke sammeln und verlinken kann. Ob die Verfasser dieser Werke bereits gemeinfrei sind oder nicht, ist dabei für mich zweitrangig. Wikisource hat meiner Meinung nach das Potential, ein strukturiertes Verzeichnis digitalisierter Originaltexte (primär, sekundär und tertiär) zu werden. Dieses Potential sollten wir nicht durch eine Regelung wie die hier vorgeschlagene abwürgen. Jonathan Groß 17:41, 12. Mai 2015 (CEST)
Ich gebe dir völlig recht, das WS ein strukturiertes Verzeichnis aller digitalisierten Quellen erstellen sollte. Genau in dieser Richtung arbeite ich ja hier mit. Die bemängelten Autorenseiten sind Urheberrechtsverletzungen und fallen nicht ins Sammelgebiet von Wikisource, denn: „Wikisource ist eine Sammlung von Quellentexten, die entweder urheberrechtsfrei sind oder unter einer freien Lizenz stehen.“ Sie sind noch urheberrechtlich geschützt und sollten daher bis zum Ablauf der Schutzfrist nicht aufgenommen werden. --Koffeeinist (Diskussion) 17:59, 12. Mai 2015 (CEST)
Ich schließe mich ganz der Meinung von Jonathan Groß an. Und noch ein Hinweis: Wir hatten in 2012 schon einmal eine Diskussion über Autoren wie Alfred Kerr, Franz Werfel, Thomas Mann etc. Damals war der Kompromiss, dass diese besser keine Autorenseite haben sollten, aber durchaus eine Personen- also Themenseite haben könnten – eine kluge Unterscheidung, wie ich finde. --Konrad Stein (Diskussion) 21:50, 12. Mai 2015 (CEST)

Ich habe ja heute nachmittag schon einige Seiten gelöscht, das war definitiv zu voreilig. Je nach Ausgang der Diskussion werde ich sie gerne wieder herstellen. Ich ja nicht vor, mich als Urheberrechtshardliner zu etablieren ;) --Koffeeinist (Diskussion) 23:38, 12. Mai 2015 (CEST)

Abstimmung[Bearbeiten]

Ich schlage vor, Hilfe:Empfehlungen für die Gestaltung von Autoren- und Themenseiten#Wer bekommt eine Autorenseite? um die folgenden zwei Regelungen zu ergänzen:

  1. Eine Autorenseite kann auch für nicht gemeinfreie Autoren angelegt werden, die ihre Werke unter einer freien Lizenz (vgl. hierzu WS:Urheberrecht) veröffentlicht haben und von denen mindestens ein Werk auf Wikisource transkribiert wurde.
  2. Eine Autorenseite kann auch für nicht gemeinfreie Autoren angelegt werden, deren Werke aber aufgrund ihrer mangelnden Schöpfungshöhe auf Wikisource transkribiert wurden.

Ich schlage darüber hinaus vor, WS:Urheberrecht folgendermaßen zu ergänzen: Texte ohne Schöpfungshöhe dürfen zur Ergänzung bestehender Projekte aufgenommen werden. Das ist der Fall, wenn es sich um eine sachliche Darstellung in einem Umfang von maximal drei Zeilen handelt. (Kommentar: die drei Zeilen entsprechen der bisherigen Praxis; ich hab das auch schon mal gelesen, weiß aber nicht mehr wo.) --Koffeeinist (Diskussion) 09:52, 12. Mai 2015 (CEST))

Pro

  • Zur Begründung siehe oben. --Koffeeinist (Diskussion) 18:46, 11. Mai 2015 (CEST)
  • Dafür --THE IT (Diskussion) 22:39, 11. Mai 2015 (CEST)
  • Einverstanden, doch halte ich die Dreizeilenregelung für zu rigide; was, wenns dreieinhalb sind? besser: „geringe Zeilenzahl, etwa drei Zeilen“
  • Freie Lizenz ist klar. Keine Ausnahmen, jede Ausnahme zieht nahezu zwangsläufig weitere Ausnahmen nach sich, siehe Kommentar von S8w4 weiter oben. Zur Schöpfungshöhe siehe unten. --9xl (Diskussion) 10:22, 13. Mai 2015 (CEST)
  • Dafür. Keine Ausnahmen, wie 9xl. – Paulis 18:26, 13. Mai 2015 (CEST)

Contra

  • Wie oben. Jonathan Groß 17:41, 12. Mai 2015 (CEST)
  • Sehe das auch so. Eine Autorenseite sollte auch angelegt werden können, wenn es von dem Autor mind. ein frei verfügbares Digitalisat im Internet gibt (das nicht unbedingt nach dt. Recht gemeinfrei sein muss).--Sinuhe20 (Diskussion) 18:06, 12. Mai 2015 (CEST)
  • siehe Jonathan und Sinuhe. --Tolanor 15:59, 13. Mai 2015 (CEST)

Wenn ich Euch richtig verstehe, die Contrastimmen sind eigentlich nicht gegen Punkt 1. & 2., sondern für einen weiteren Punkt 3. etwa „Eine Autorenseite sollte auch angelegt werden können, wenn es von dem Autor mind. ein frei verfügbares Digitalisat im Internet gibt (das nicht unbedingt nach dt. Recht gemeinfrei sein muss)“. Manche Prostimmen fürchten da Uferlosigkeit oder Uneindeutigkeit. Könnte ein Kompromiß erreicht werden etwa durch weitere Einschränkungen (z.B. das Digitalisat muß auf renommierten Server liegen und in der US oder Canada urheberrechtfrei sein, und streichen von „Ausnahmen z. B. für ... sind möglich.“) ? Bei Zeitschriftenjahrgänge machen wir es ja sowieso schon jetzt so. S8w4 (Diskussion) 05:32, 15. Mai 2015 (CEST)

Es gibt ja schon einige Ausnahmen, z.B. darf nicht-gemeinfreie Sekundärliteratur aufgeführt werden (NDB, historische oder moderne Dissertationen etc.). Konrad hat weiter oben auf eine ältere Diskussion verwiesen, in der die Anlage von Personenseiten für nicht-gemeinfreie Autoren vorgeschlagen wird. Dann könnten Sekundärliteratur und Rezeptionszeugnisse für die Autoren gesammelt werden, die Werke würden dann eben im Jahr vor ihrer Gemeinfreiheit dazukommen und eine vollständige Auorenseite ergeben. Ich möchte aber zusammenfassend feststellen, dass wir über gut zwei dutzend Autorenseiten reden, die für nicht-gemeinfreie Autoren angelegt wurden. Der übergreifende Konsens ist also, dass WS schwerpunktmäßig gemeinfreie Werke und Autoren behandelt und nachweist. In Frage steht nur, wie genau wir Ausnahmen definieren und wie streng wir sie handhaben wollen. Meine Vorschläge zielen darauf ab, die bisherige Praxis so liberal wie möglich festzuschreiben, WS ansonsten aber mit klaren Kriterien vor möglichen Klagen von Erben und Rechtsnachfolgern zu schützen. --Koffeeinist (Diskussion) 09:31, 15. Mai 2015 (CEST)

Keine URV[Bearbeiten]

Hilfreich für den Benutzer ist anders. Wir sollten die Kirche im Dorf lassen. Groß hat das schon so formuliert, dass ich es nur fetten muss. Wo verletzen wir denn das Urheberrecht? Ich bin kein Jurist, aber nach meinem Verständnis macht man sich nicht strafbar, wenn man auf das Angebot eines Dritten verweist. Wenn bei Google Books oder im Internet Archive oder bei Gallica Digitalisate von Werken liegen, die nach deutschem Urheberrecht noch geschützt sind, dann dürfen wir diese Werke selbstverständlich nicht hier auf Wikisource transkribieren. Aber wir dürfen doch wohl auf Themen- und Autorenseiten darauf verlinken! Darin besteht für mich ein großer Nutzen von Wikisource, gerade auch in meiner wissenschaftlichen Arbeit, weil ich hier alle möglichen digital verfügbaren Werke sammeln und verlinken kann. Als Urheberrechtsfachautor kann ich bestätigen, dass ich kein urheberrechtliches Risiko sehe.

Wir sprechen über einige wenige Autorenartikel, die nach meiner Ansicht vorschnell gelöscht wurden. Ich würde für eine weitgehende Liberalisierung plädieren: Eine Autorenseite soll bekommen, wer a) in 11 Jahren gemeinfrei wird. Dann ist Thomas Mann auch im Boot. --FrobenChristoph (Diskussion) 23:03, 15. Mai 2015 (CEST)

Schöpfungshöhe[Bearbeiten]

Das UrhG sagt dazu „Werke im Sinne dieses Gesetzes sind nur persönliche geistige Schöpfungen“. Die Rechtsprechung dazu ist verwirrend, um es ganz vorsichtig auszudrücken. Nach meiner Meinung sollten wir hier äußerst restriktiv damit umgehen.

Für unbedenklich halte ich bspw. RE:Verweisungen die einen Autor haben. Das sind rein technische Einrichtungen. Bei allem was darüber hinaus geht, sollte man sich fragen:

  • kann ich beurteilen ob es sich um eine persönliche geistige Schöpfung handelt?
  • würde ich auch so entscheiden, wenn mein Name als für den Inhalt verantwortlich im Impressum stehen würde?

Die Last einer möglichen juristischen Auseinandersetzung trägt nämlich der Serverbetreiber. Und den Server brauchen wir um unsere freien Inhalte zu publizieren. --9xl (Diskussion) 10:53, 13. Mai 2015 (CEST)

Eine Schöpfungshöhe würde ich immer dann verneinen, wenn der Autor aus frei zugänglichen Werken Gemeinfreier schöpft, d. h. sie ohne eigene abweichende Auslegung lediglich zitiert, oder wenn er eine Binsenweisheit ausspricht. Wer also beispielsweise eine Passage aus CIG XIII wiedergibt oder aus einem Lexikon abschreibt, kann sich nicht auf das Urheberrechtsgesetz berufen. Und von solchen Passagen wimmelt es in einem Lexikon wie den RE. --Pfaerrich (Diskussion) 14:52, 13. Mai 2015 (CEST)
Da würde ich etwas vorsichtig sein, auch die Auswahl und Zusammenstellung von Zitaten kann eine eigene geistige Schöpfung sein.--Sinuhe20 (Diskussion) 16:27, 13. Mai 2015 (CEST)

Wir hatten das bezüglich der RE schon öfter. Aber eine neue Generation möchte halt alle alten Fehler wiederholen. Sehr einfache Artikel in der RE haben keine Schöpfungshöhe. Was sehr einfach ist, lässt sich nicht mit Zeichenzahlen angeben. Der Serverbetreiber sitzt in den USA und hat wiederholt deutlich gemacht, zB bei der URAA-Problematik, dass er nur bei Take-Down-Aufforderungen von sich aus aktiv werden wird. Wir sollten hier nicht übermütig werden, aber sich bei einem 3-Zeilen-Artikel der RE sich in die Hose zu machen ist aus URV-Sicht Paranoia. Deswegen wird nie jemand vor einem deutschen Gericht klagen. Und in den USA nimmt der Betreiber den Artikel bei Take-down-Aufforderung (die aber auch nicht zu erwarten ist) mittels Office-Action vom Netz und ist dann aus dem Schneider. Grauzonen für uns mit Vorsicht nutzen! --FrobenChristoph (Diskussion) 23:10, 15. Mai 2015 (CEST)

Wikidata: Access to data from arbitrary items is coming[Bearbeiten]

(Sorry for writing in English)

When using data from Wikidata on Wikipedia and other sister projects, there is currently a limitation in place that hinders some use cases: data can only be accessed from the corresponding item. So, for example, the Wikipedia article about Berlin can only get data from the Wikidata item about Berlin but not from the item about Germany. This had technical reasons. We are now removing this limitation. It is already done for French Wikisource and Dutch Wikipedia. Your project is one of the next ones:

  • 18. May: Farsi Wikipedia, English Wikivoyage, Hebrew Wikipedia
  • 1. June: Italian Wikipedia, all remaining Wikisource

We hope to have it rolled out nearly everywhere by the end of June 2015.

We invite you to play around with this new feature if you are one of the people who have been waiting for this for a long time. If you have technical issues/questions with this you can come to d:Wikidata:Contact the development team.

A note of caution: Please be careful with how many items you use for a single page. If it is too many pages, loading might get slow. We will have to see how the feature behaves in production to see where we need to tweak and how.

How to use it, once it is enabled:

Cheers Lydia Pintscher 17:19, 13. Mai 2015 (CEST)

Massen-Download von Commons[Bearbeiten]

Hier oder in der Technikwerkstatt wurde gelegentlich die Frage nach einem Werkzeug für den automatischen Download einer größeren Anzahl von Dateien von Commons gestellt. Ich bin heute auf Imker gestoßen. Das Werkzeug lädt den Inhalt einer ganzen Commons-Kategorie auf den lokalen Computer herunter. Ich habe es gerade probiert: Es geht flott zu Werke und ohne überflüssige Gimmicks. Es scheint aber ratsam das Programm nach einem gescheiterten Versuch oder einer Fehleingabe zu schließen und bei Bedarf neu zu starten. --9xl (Diskussion) 10:08, 14. Mai 2015 (CEST)

Nochmals Internet Archive[Bearbeiten]

Wenn man einen beliebigen IA-Link von uns anklickt, kommt man (manchmal/häufig?) zur Startseite des IA ... --FrobenChristoph (Diskussion) 23:13, 15. Mai 2015 (CEST)

Ja. – Paulis 23:19, 16. Mai 2015 (CEST)

Wikimedia Highlights, April 2015[Bearbeiten]

Hier sind die Höhepunkte des Wikimedia-Blogs vom April 2015.
Wikimedia Foundation RGB logo with text.svg
About · Subscribe · Distributed via MassMessage (wrong page? Correct it here), 07:55, 17. Mai 2015 (CEST)

Fehlender Berabeitungs-Button zum 2.[Bearbeiten]

Mir ist aufgefallen, dass der grüne Bearbeitungs-Button nicht mehr vorhanden ist. Wo isser denn hin? Ist das Problem bekannt und vielleicht Resultat eines aktuellen System-Updates? --Bodhi-Baum (Diskussion) 17:11, 5. Apr. 2015 (CEST)

Ich muss leider meine Nachfrage nach dem grünen Bearbeitungs-Button (Bearbeitungsstand:fertig) noch einmal erneuern. Nach der Bearbeitung des Artikels Der neue Präsident des Reichsgerichts. Wollte ich den Bearbeitungsstand aktualisieren - nämlich auf "fertig" fand aber den Button nicht vor. Woran liegt das? --Bodhi-Baum (Diskussion) 16:29, 17. Mai 2015 (CEST)
Klickibunti gibts nur im Namensraum Seite. Den Bearbeitungsstand des Präsidenten musst du wohl ganz klassisch in der Textbox auf fertig ändern. – Paulis 20:08, 17. Mai 2015 (CEST)
Ok, wenn das so ist, werde ich das mal umsetzen. Danke Paulis :-)--Bodhi-Baum (Diskussion) 12:21, 23. Mai 2015 (CEST)

Wikimedia Foundation Board of Trustees elections 2015[Bearbeiten]

Wmf logo vert pms.svg

This is a message from the 2015 Wikimedia Foundation Elections Committee. Translations are available.

Voting has begun for eligible voters in the 2015 elections for the Wikimedia Foundation Board of Trustees. Questions and discussion with the candidates for the Board will continue during the voting.

The Wikimedia Foundation Board of Trustees is the ultimate governing authority of the Wikimedia Foundation, a 501(c)(3) non-profit organization registered in the United States. The Wikimedia Foundation manages many diverse projects such as Wikipedia and Commons.

The voting phase lasts from 00:00 UTC May 17 to 23:59 UTC May 31. Click here to vote. More information on the candidates and the elections can be found on the 2015 Board election page on Meta-Wiki.

On behalf of the Elections Committee,
-Gregory Varnum (User:Varnent)
Volunteer Coordinator, 2015 Wikimedia Foundation Elections Committee

Posted by the MediaWiki message delivery 17:20, 17 May 2015 (UTC) • TranslateGet help

Rhinocerus (Nachdruck)[Bearbeiten]

Aus Rhinocerus (Nachdruck) unbedingt die Bilder rausnehmen. Die enthalten nämlich gerade NICHT den wiedergegebenen Text sondern eine andere Fassung. Das ist absolut irritierend. --88.76.218.28 01:19, 20. Mai 2015 (CEST)

Da hatte jemand auf Commons eine neue Version mit verändertem Text hochgeladen. Ich habe dieses mal revertiert. --THE IT (Diskussion) 10:37, 20. Mai 2015 (CEST)

Zeitschriften – Revision 2015[Bearbeiten]

Es findet gerade eine größere Aufräumaktion statt: Diskussion:Zeitschriften#Revision_2015. Bitte großzügig Sachkenntnis einfließen lassen. Viele Grüße von --Konrad Stein (Diskussion) 14:16, 22. Mai 2015 (CEST)