MobileRead Forums - View Single Post - Buchmacher-Treff: Small Talk & Diskussionen

Doitsu · 02-21-2013, 10:56 AM

Ich habe mal testhalber eine ziemlich gute Fraktur-Vorlage mit der neuesten Version des kostenlosen OCR-Programms "Tesseract" (und deutschen Fraktur-Trainingsdaten) erkennen lassen und eine Erkennungsrate von nur ca. 60% erreicht.
Ist das normal bei Fraktur oder kann man mit Tesseract durch gezieltes Training auch höhere Raten erzielen?
Falls ja, würde ich mich freuen, wenn jemand eine kurze idiotensichere Anleitung schreiben könnte, wie man die bereits vorhandenen deutschen Training-Daten erweitern oder neue buchspezifische Trainingsdaten erstellen kann.
(Die Anleitungen, die ich bis jetzt gefunden habe, setzen alle umfassende Linux/Programmierkenntnisse voraus.)

02-21-2013, 10:56 AM	#169
Doitsu Grand Sorcerer Posts: 5,584 Karma: 22735033 Join Date: Dec 2010 Device: Kindle PW2	Fraktur-OCR mit Tesseract? Ich habe mal testhalber eine ziemlich gute Fraktur-Vorlage mit der neuesten Version des kostenlosen OCR-Programms "Tesseract" (und deutschen Fraktur-Trainingsdaten) erkennen lassen und eine Erkennungsrate von nur ca. 60% erreicht. Ist das normal bei Fraktur oder kann man mit Tesseract durch gezieltes Training auch höhere Raten erzielen? Falls ja, würde ich mich freuen, wenn jemand eine kurze idiotensichere Anleitung schreiben könnte, wie man die bereits vorhandenen deutschen Training-Daten erweitern oder neue buchspezifische Trainingsdaten erstellen kann. (Die Anleitungen, die ich bis jetzt gefunden habe, setzen alle umfassende Linux/Programmierkenntnisse voraus.)