Wikisource Diskussion:Statistik

aus Wikisource, der freien Quellensammlung
Wechseln zu: Navigation, Suche

Änderungen[Bearbeiten]

Änderungen an den zu zählenden Daten sollten nur in gut begründeten Fällen vorgenommen werden, sonst sind die Zahlen ja nicht vergleichbar. --9xl 20:55, 6. Jul. 2009 (CEST)

Jedenfalls ist so oder so die Anzahl der Autorenseiten nicht exakt, da die 125 anderen Kategorien mitgezählt werden, wo die Autorenseite bereits gezählt wurde. Die 125 müssen also trotzdem abgezogen werden. Wieviele ADB-Autoren auch eine Autorenseite haben, lässt sich nicht genau bestimmen (schade dass für unser Projekt die Vorlagenauswertung nicht aktiv ist). --enomil 21:10, 6. Jul. 2009 (CEST)
Ich habe 30 ADB:Autoren nachgesehen, 23 davon hatten auch einen Eintrag in der Kategorie:Autoren; das ist schon viel. Wenn noch etwas an der Zählerei zu ändern ist, sollte das wirklich jetzt geschehen. Meine Idee war, dass im Lauf der Zeit halt die Entwicklung sichtbar wird. -- mfg --9xl
An der Idee ist ja nichts auszusetzen, nur müssen die Zahlen halbwegs stimmen (das heißt Subkategorien abziehen oder dazunehmen). Ich bin trotzdem dafür die 126 Subkategorien von Kategorie:Autor abzuziehen, das würde dann alle wirklichen Autorenseiten zählen. --enomil 11:31, 7. Jul. 2009 (CEST)
Das ist auch viel, ich habe die Subtraktion also wieder reingebaut und auch noch andere. Die paar historischen Zahlen auch korrigiert. Die Anzahl der Unterkategorien müsste eigentlich dann auch immer mitgeführt werden, woran ich allerdings nicht glaube da es die Systemvariable SUBCATEGORIESINCATEGORY nicht gibt ;-) Soviel zur Genauigkeit. --9xl 16:18, 8. Jul. 2009 (CEST)

100k Bearbeitungen[Bearbeiten]

Wer ist denn die Arbeitsbiene mit den über 100.000 Bearbeitungen? --Jmb1982 09:38, 30. Sep. 2010 (CEST)

Ich habe mir fest vorgenommen, keine Personendaten öffentlich zu machen, um solche Diskussionen zu vermeiden. In diesem Fall kann ich aber auf die offizielle Statistik (nach unten scrollen) verweisen. --9xl 10:44, 30. Sep. 2010 (CEST)
Alles klar... Danke... War auch meine Vermutung :-) --Jmb1982 10:47, 30. Sep. 2010 (CEST)

Statistik ohne Großprojekte...[Bearbeiten]

Hallo 9xl,

mich würde - wenn du sowieso die nächste Monatsstatistik erstellst und es nicht zu viel Aufwand ist - einfach mal interessieren, wie unsere Seiten-Statistik aussähe, ohne die beiden Groß- und Langzeitprojekte ADB und Gartenlaube... Ich hab mich mal halbwegs durchgeklickt, es dürften gut 26.000 der unkorrigierten Seiten Gartenlaube + ADB sein, zudem über 18.000 Seiten im Status "korrigiert"... Mich würde einfach nur interessieren, wie wir ohne die beiden Projekte dastehen würden. Wenns aber nicht geht, gehts halt nicht... Danke und Gruß --Jmb1982 16:14, 22. Okt. 2010 (CEST)

Diese Frage gibt mir Gelegenheit mal auszuplaudern, was da gemacht wird:
Die Tabelle Bearbeitungsstand enthält zwei Auswertungen, Werke und Seiten.
Seiten ist schnell abgehandelt. Benutzer:ThomasV stellt auf dem Toolserver einige Zahlen bereit, wie http://toolserver.org/~thomasv/cgi-bin/pagesinns.pl?server=3&db=dewikisource&ns=102&cat=Korrigiert , die ich nutze. Diese Funktionen bieten keine Möglichkeit irgend etwas aus der Erfassung auszuschließen, bzw. mir ist nichts dergleichen bekannt.
Für Werke nutze ich Catscan, bspw. http://toolserver.org/~daniel/WikiSense/CategoryIntersect.php?wikilang=de&wikifam=.wikisource.org&basecat=Werke&basedeep=1&mode=cs&tagcat=Korrigiert&tagdeep=1&userlang=de . Die Ausgabe bricht allerdings bei 1000 Seiten ab und verrät nicht wieviele es tatsächlich sind. Wenn man aber das Ausgabeformat Wikitext oder CSV wählt, wird eine vollständige Liste ausgegeben und man braucht nur noch die Zeilen zu zählen ;-)
Zurück zu deiner Frage: ADB-Artikel sind nicht in die Kategorie Werke eingeordnet und die Scans sind extern und nicht im Namensraum Seite. Damit sind ADB-Artikel nicht in der Auswertung der Bearbeitungsstände enthalten. Ein Gartenlauben-Artikel ist dagegen ein Werk und in der Auswertung enthalten. Die Gartenlaube auszuschließen ist nach meinem Wissensstand nicht möglich, aber du kannst gerne eigene Experimente mit Catscan anstellen. Stand von heute:
Mit freundlichen Grüßen 9xl 10:57, 23. Okt. 2010 (CEST)

Basierend auf dieser Grundlage: Einträge in der Kategorie:Die Gartenlaube (Tiefe 2) und

Die ersten beiden Zahlen habe ich gerundet, da auch andere Einträge berücksichtigt wurden (bspw. Jahresseiten), die letzte hat den Stand von jetzt (oder das, was der Toolserver für aktuell hält). Nicht berücksichtigt ist in diesen Zahlen, dass es viele Seiten gibt, die mehr oder weniger teilkorrigiert sind, weil sich der Korrekteur nur für einen Teil der Texte interessierte, PR2 jedoch keine derartige Kennzeichnung kennt. --32X 02:13, 24. Okt. 2010 (CEST)

Sagen, Fabeln etc.[Bearbeiten]

Bei der entsprechenden Zahl fehlen die Kategorien Reimfabel und Sagenballade. Der Jahresanfang bietet sich vll. an die Zahl entsprechend zu korrigieren. Gruß -- Finanzer 18:55, 1. Jan. 2011 (CET)

Gemacht. --9xl 21:21, 1. Jan. 2011 (CET)

Benutzerstatistik[Bearbeiten]

Als Quelle für die Editzahlen habe ich mit einem Script Soxred93 Editcounter abgefragt. Das funktioniert leider nicht mehr. Schon im Mai 2011 gab es Schwierigkeiten, die ich noch überwinden konnte indem ich meine Abfragen als Firefox unter Windows 7 tarnte. Im Juni hat der Programmierer offenbar weitere Hürden eingebaut um automatische Abfragen zu blocken. Diese konnte ich bisher nicht überwinden. Deshalb kann ich die Benutzerstatistik vorerst nicht weiterführen. --9xl 15:42, 30. Jun. 2011 (CEST)

 :-)) 9xl 13:03, 30. Jul. 2011 (CEST)

Der Betreiber des Editcounters hat sich etwas neues einfallen lassen, was dazu führt dass eine automatische Abfrage unserer ca. 2800 Benutzer etwa 24 Stunden dauern würde - wenn er nicht ein einziges mal hängen bleibt. Ich kann diesen Service also nicht weiterführen. --9xl 10:50, 30. Nov. 2011 (CET)

Bearbeitungen der Mitarbeiter[Bearbeiten]

Sicher kriegt mans auch im Koppe raus, ich finde aber die Bearbeitungen der Mitarbeiter könnten neben den Bots auch als Summe da stehen? -- Paulis 19:29, 8. Aug. 2011 (CEST)

Seitenaufrufe[Bearbeiten]

Ich werde Wikisource:Statistik/Seitenaufrufe nicht weiterführen. Die Daten von http://dammit.lt/wikistats erscheinen unzuverlässiger als je, die Diskrepanzen zur offiziellen Statistik sind riesig, sodass diese Auswertung nur noch den Wert einer Spielerei hat. Hinzu kommt, das die Seite nur noch sporadisch erreichbar ist, der Betreiber hat anscheinend das Interesse an der Sache verloren.

Wenn sich jemand weiterhin damit befassen möchte, ich stelle die Scripte zur Verfügung, Kontakt per Wikimail. Gebraucht wird PHP, Mysql und ca. 60 GB Download pro Monat. --9xl 10:30, 22. Okt. 2011 (CEST)

Topographia[Bearbeiten]

Hallo.

Werden neben den Einzelseiten auch die Ortstexte der Topographia-Werke irgendwo in der Statistik erfasst? Macht es sich in der Statistik bemerkbar, dass ich gerade dabei bin, den korrekten Bearbeitungsstand von 150 Orten nachzutragen? --Jmb1982 11:52, 20. Feb. 2012 (CET)

Nein. Nur die Topographien, also Franconiae, Hassiae, usw. stehen in der Kategorie Werke, nicht die einzelnen Ortsartikel. Ich denke, das ist auch richtig so. --9xl 18:26, 20. Feb. 2012 (CET)
Danke... Da will man mal die Statistik pimpen und alles Essig :-) --Jmb1982 18:36, 20. Feb. 2012 (CET)

Dauernd aktive Benutzer[Bearbeiten]

Da die Quelle Spezial:Aktive_Benutzer verschwunden ist, kann diese Auswertung nicht mehr weitergeführt werden. --9xl (Diskussion) 09:00, 30. Apr. 2013 (CEST)

Bot-Edits[Bearbeiten]

Für die Bot-Edits habe ich bisher die Anzahl der sichtbaren Edits des Bearbeitungszählers benutzt. Das kann aber zu inkonsistenten Zahlen führen, z. B.:

Im April 2014 wurden 473 Edits von Benutzer:MediaWiki default gelöscht. Das führte zu einer Summe von 1621 Bot-Edits, aber allein Benutzer:Fkraus hat in diesem Monat mehr als 2000 Bearbeitungen.

Ich habe deshalb das Verfahren auf die Gesamtzahl der Edits umgestellt und die Monatszahl per Hand ermittelt (wir haben ja nur vier bis fünf aktive Bots). Dadurch passen in diesem Monat die Zahlen nicht zusammen, in Zukunft sollten aber keine Inkonsistenzen mehr auftauchen. --9xl (Diskussion) 11:04, 30. Apr. 2014 (CEST)