Calibre: Seine Art und Weise Absatzgrenzen in PDFs zu ermitteln
Im Handbuch von Calibre heißt es zum Thema Absatzgrenzen erkennen:
"Meaning, it is very difficult to determine where one paragraph ends and another begins. calibre will try to unwrap paragraphs using a configurable, Line Un-Wrapping Factor. This is a scale used to determine the length at which a line should be unwrapped."
Ist Zeilenlänge das einzige Kriterium nach dem Calibre vorgeht?
Verwendet es z.B. keine Kriterien wie "Erstzeileneinrückung eines Absatzes" oder "Abstand zwischen Absätzen"?
Wie bewerten diejenigen von Euch, die schon verschiedene Werkzeuge zum Konvertieren von PDF nach ePub (es soll explizit nicht um die Fähigkeiten zur Verwaltung von Buchbeständen gehen) ausprobiert haben, Calibre im Vergleich in dieser Disziplin?
Insbesondere würde mich der Vergleich zu Mobipocket interessieren.
Noch etwas zum Hintergrund: Ich möchte keine OCR-Software auf PDFs loslassen. Zwar kann auf diesem Weg mit der Zutat "enorme Menge an Handarbeit" sicher sehr gute Ergebnisse beim Konvertieren erzielen, aber solche Wege möchte ich nicht beschreiten. Sie sind mir zu zeitaufwändig.
|