Benutzer Diskussion:Casimir~dewikisource

Seiteninhalte werden in anderen Sprachen nicht unterstützt.
aus Wikisource, der freien Quellensammlung

Hallo Casimir, tolle Sache mit deiner Zeichenerkennung. Vor allem mit, zumindest in meinen Auge, sehr zuügigen Ergebnissen. Respekt! Aber bitte nimm die Frakturerkennung mit auf den Plan. Frohes Schaffen und Gruß Xarax (Diskussion) 18:52, 25. Okt 2005 (UTC)

Fraktur ist prinzipiell kein Problem, denn das Programm ordnet nicht unmittelbar den Zeichen-Bildern die entsprechenden Buchstaben zu, sondern kann zunächst einmal nur die Zeichen-Bilder untereinander vergleichen. Der Anwender muss dem Programm beibringen, um welchen Buchstaben es sich bei dem jeweiligen Bild handelt (das meine ich mit "lernen" und "Training"), so dass nachfolgende Zeichen, die ähnlich aussehen, als dieser Buchstabe erkannt werden. Man muss mit jedem Buch neu trainieren, weil die Zeichen meistens anders aussehen. Damit die Zeichenerkennung funktioniert, müssen alle Zeichen-Bilder, die für den gleichen Buchstaben stehen, innerhalb eines Buches sehr ähnlich aussehen. Beim Blitz-Lexikon ist das offenbar der Fall, jedenfalls bei den meisten Buchstaben. Je weiter man allerdings zeitlich zurückgeht, desto weniger ausgereift wird sicherlich die Drucktechnik gewesen sein, so dass es sein könnte, dass man mit älteren, in Frakturschrift gesetzen Büchern Probleme bekommt.
Viel mehr Arbeit wird aber noch die Verallgemeinerung der Seiten-Segmentierung machen, d.h. der Erkennung der Spalten und Bilder und der Lage der einzelnen Zeilen. Ich habe diesen Teil des Programms bis jetzt speziell für das Blitz-Lexikon geschrieben, um möglichst schnell zu einem Ergebnis zu kommen. Aber das kann natürlich auf Dauer nicht so bleiben.--Casimir 21:30, 27. Okt 2005 (UTC)

Dein Konto wird umbenannt[Bearbeiten]

23:42, 17. Mär. 2015 (CET)

Umbenannt[Bearbeiten]

w

05:55, 19. Apr. 2015 (CEST)