Quote:
Vielen Dank dafür ! Ob das für Prosa auch 'ne Option is?
|
Vielen Dank für Ihre Frage.
Meines Erachtens ist es auch für Prosa eine Option, allerdings die letzte. Das (manuelle) Wiederherstellen der Absätze ist m. E. aufwändiger als es scheint. Tessaract-OCR's bieten hier so gut wie keine Unterstützung. Dies sollte man bedenken. Aber probieren, wie man damit zurecht kommt, kann doch nix schaden, oder ??
Es erinnert mich an PDF-Konvertierungen, hier wird man in der Regel vor dem gleichen Problem stehen. Allerdings wird bei PDF mit Glück noch eine Leerzeile zwischen den Absätzen erscheinen, was die Chance zu einer technischen Lösung mit S&E erhöht.