View Single Post
Old 02-21-2013, 10:56 AM   #169
Doitsu
Wizard
Doitsu ought to be getting tired of karma fortunes by now.Doitsu ought to be getting tired of karma fortunes by now.Doitsu ought to be getting tired of karma fortunes by now.Doitsu ought to be getting tired of karma fortunes by now.Doitsu ought to be getting tired of karma fortunes by now.Doitsu ought to be getting tired of karma fortunes by now.Doitsu ought to be getting tired of karma fortunes by now.Doitsu ought to be getting tired of karma fortunes by now.Doitsu ought to be getting tired of karma fortunes by now.Doitsu ought to be getting tired of karma fortunes by now.Doitsu ought to be getting tired of karma fortunes by now.
 
Doitsu's Avatar
 
Posts: 1,902
Karma: 4632610
Join Date: Dec 2010
Device: Kindle PW2
Fraktur-OCR mit Tesseract?

Ich habe mal testhalber eine ziemlich gute Fraktur-Vorlage mit der neuesten Version des kostenlosen OCR-Programms "Tesseract" (und deutschen Fraktur-Trainingsdaten) erkennen lassen und eine Erkennungsrate von nur ca. 60% erreicht.
Ist das normal bei Fraktur oder kann man mit Tesseract durch gezieltes Training auch höhere Raten erzielen?
Falls ja, würde ich mich freuen, wenn jemand eine kurze idiotensichere Anleitung schreiben könnte, wie man die bereits vorhandenen deutschen Training-Daten erweitern oder neue buchspezifische Trainingsdaten erstellen kann.
(Die Anleitungen, die ich bis jetzt gefunden habe, setzen alle umfassende Linux/Programmierkenntnisse voraus.)
Doitsu is offline   Reply With Quote