Ich habe mal testhalber eine ziemlich gute Fraktur-Vorlage mit der neuesten Version des kostenlosen OCR-Programms "
Tesseract" (und deutschen Fraktur-Trainingsdaten) erkennen lassen und eine Erkennungsrate von nur ca. 60% erreicht.
Ist das normal bei Fraktur oder kann man mit Tesseract durch gezieltes Training auch höhere Raten erzielen?
Falls ja, würde ich mich freuen, wenn jemand eine kurze idiotensichere Anleitung schreiben könnte, wie man die bereits vorhandenen deutschen Training-Daten erweitern oder neue buchspezifische Trainingsdaten erstellen kann.
(Die Anleitungen, die ich bis jetzt gefunden habe, setzen alle umfassende Linux/Programmierkenntnisse voraus.)