Quote:
Originally Posted by mtravellerh
Sieht noch besser aus, wenn Du per RegEx die Seitenzahlen verschwinden lässt. Das Resultat dürfte durchaus lesbar ausfallen!
|
Ich habe keine Seitenzahlen, wahrscheinlich speichert der Adobereader anders als pdftotext.
Habe mir nochmal die man-page von pdftotext durchgelesen, demnach ist der Parameter
-raw deprecated. Es gibt noch
-layout, hier wird versucht möglichst viel vom Original zu übernehmen, aber am Besten ist das Ergebnis wenn ich pdftotext ohne Parameter aufrufe.
Code:
pdftotext quelldatei.pdf zieldatei.txt
Die Nachbearbeitung im vim kann sogar entfallen, da offensichtlich die unschönen Zeilenschaltungen des Autors schon getilgt sind!