Quote:
Originally Posted by netseeker
Wäre es sinnvoll eine Option zum automatischen "Auftrennen" mehrspaltiger PDF's einzubauen? Das Originallayout wandert dann natürlich ins Nirvana aber andererseits ist der OCR-Output (aufgrund der fehlenden Layoutanalyse in Tesseract) ansonsten ohnehin nicht wirklich zu gebrauchen.
PS: Muss noch ein paar Bugs finden, dann gibt es wieder Screenshots!
|
Ich finde die Sache mit den mehrspaltigen PDFs eine gute Idee, sehe sie aber nicht als primär an! Vielleicht könntest Du sie ja im Laufe der Entwicklung integrieren!