View Single Post
Old 05-20-2011, 04:00 AM   #19
kbaerwald
BioReader
kbaerwald understands when you whisper 'The dog barks at midnight.'kbaerwald understands when you whisper 'The dog barks at midnight.'kbaerwald understands when you whisper 'The dog barks at midnight.'kbaerwald understands when you whisper 'The dog barks at midnight.'kbaerwald understands when you whisper 'The dog barks at midnight.'kbaerwald understands when you whisper 'The dog barks at midnight.'kbaerwald understands when you whisper 'The dog barks at midnight.'kbaerwald understands when you whisper 'The dog barks at midnight.'kbaerwald understands when you whisper 'The dog barks at midnight.'kbaerwald understands when you whisper 'The dog barks at midnight.'kbaerwald understands when you whisper 'The dog barks at midnight.'
 
kbaerwald's Avatar
 
Posts: 292
Karma: 42568
Join Date: Apr 2009
Location: Germany
Device: Various
Hallole ... hier überschlagen sich ja die Aktivitäten! Hier einmal eine kleine Kochanleitung für Windows Anwender, die sich auch auf Betriebssystemebene bewegen können (Kenntnisse von DOS und den benötigten Kommandos sind leider erforderlich):
  • Schritt 1: Lade herunter von http://code.google.com/p/tesseract-ocr/downloads/list : tesseract-ocr-setup-3.00.exe und deu-frak.traineddata.gz
  • Schritt 2: Entpacke und installiere mit tesseract-ocr-setup-3.00.exe, entpacke in das Unterverzeichnis \tessdata die Datei deu-frak.traineddata
  • Schritt 3: im Verzeichnis C:\Program Files (x86)\Tesseract-OCR sollten jetzt folgende Elemente zu sehen sein (siehe Anhang Textfile liste.txt
  • Schritt 4: auf Kommandozeilenebene wird z.B. folgender Befehl gegeben: tesseract f:\temp\img01.tif f:\temp\img01 -l deu-frak
Damit habe ich die erste Hürde überwunden: ich lasse mit tesseract ein Bild mit dem Namen img01.tif im Verzeichnis F:\temp so bearbeiten, daß ein Textfile mit dem Namen img01.txt imselben Verzeichnis ausgegeben wird. Der Befehl -l deu-frak weist tesseract an auf die Trainingsbibliothek desselben Namens zuzugreifen. Normaler deutscher Text (keine Fraktur) wird also mit -l deu bearbeitet [edit], wobei diese natürlich vorhanden sein muß!

Training u.s.w. ist dann komplizierter und da helfen die von piff genannten Links weiter.

Klaus
Attached Files
File Type: txt liste.txt (3.6 KB, 794 views)

Last edited by kbaerwald; 05-20-2011 at 04:05 AM.
kbaerwald is offline   Reply With Quote