Quote:
Originally Posted by Moredread
...Mit einem schlichten pdf2txt kann ich jedenfalls einen Fließtext daraus machen. Wenn Du das nicht schaffst dürfte es wohl an Dir liegen, wenn ich es hinkriege. Mit ein bisschen Code obendrauf wird sogar genug Formatierung übernommen, das sich ein normaler Roman problemlos übertragen lässt...
|
Hallo Moredread,
ich habe mal Deine Datei Auto - Fließtext ohne Grafik.pdf mit pdf2txt konvertiert. Das Ergebnis siehst Du unten im Screenshot - kein Fließtext, sondern einzelne Zeilen mit einem Zeilenumbruch überall dort, wo auch im PDF eine neue Zeile beginnt.
Eine Reflow-Funktion würde somit jede
Zeile für einen
Absatz halten müssen und damit sind wir wieder am Anfang. Es gibt keine einfache Möglichkeit, aus einem PDF Fließtext zu extrahieren. Den Gegenbeweis bist Du trotz viel Brimborium immer noch schuldig.