Quote:
Originally Posted by Leonatus
...
Ich wusste bisher nicht, dass man bei google docs auch Fraktur erkennen kann. Ist das so?
...
|
Das Verfahren, welches Frodok und ich anwenden, beruht darauf, dass in GoogleBooks zusätzlich zum gezeigten PDF auch oft eine ePub-Version heruntergeladen werden kann; ist dies nicht der Fall, kann eine OCRte Fassung über die "Plain text"-Darstellung 'gepflückt' werden. Beide sind fehlerhaft, letztere oft krass, und müssen Wort für Wort Korrektur gelesen werden.
Unser Forumspionier für tesseract-OCR bei Fraktur ist übrigens
mmat1.