View Single Post
Old 12-09-2015, 03:21 AM   #2
Foxi
Enthusiast
Foxi ought to be getting tired of karma fortunes by now.Foxi ought to be getting tired of karma fortunes by now.Foxi ought to be getting tired of karma fortunes by now.Foxi ought to be getting tired of karma fortunes by now.Foxi ought to be getting tired of karma fortunes by now.Foxi ought to be getting tired of karma fortunes by now.Foxi ought to be getting tired of karma fortunes by now.Foxi ought to be getting tired of karma fortunes by now.Foxi ought to be getting tired of karma fortunes by now.Foxi ought to be getting tired of karma fortunes by now.Foxi ought to be getting tired of karma fortunes by now.
 
Posts: 35
Karma: 1560432
Join Date: Dec 2015
Device: none
Hallo zusammen,

da ich inzwischen einige Erfahrungen bei der Textumwandlung von Frakturschrift habe, kann ich dazu was beitragen.


Scannen
Bisher hatte ich das Glück, den Scan über mein Multifunktionsgerät durchführen zu können, weil mir bei Dokumentscan die Funktion "Durchschein-Effekt reduzieren" zur Verfügung steht. Ich bin da manchmal erstaunt, wie weiß der Hintergrund ist, wenn die Vorlage stark gebräunt ist. Ich denke, daß das für die spätere Texterkennung hilfreich ist.

Ich scanne mit 300 dpi und speichere im tif-Format ab.

Vorbereitung
Praktisch für die Texterkennung hat sich erwiesen, dass ich alle Scan-Dateien durchgehe und die Texte begradige (bei schrägen Scan) und zuschneide, soweit erforderlich. Diese mache ich mit Paint.NET

Umwandlung
Für die Umwandlung zu Text, nutze ich auch Tesseract. Aber die Umwandlung selbst führe ich nicht in einen Grafik-Programm durch, sondern über die Windows-Kommando-Ebene. Nach dieser Hilfeanleitung konnte ich die Befehle meinen Gegebenheiten anpassen und das funktionierte super.

Last edited by Foxi; 02-21-2020 at 07:06 AM. Reason: Schreibfehler korrigiert
Foxi is offline   Reply With Quote