Ja mit dem Ansatz am Zeilenende habe ich heute abend auch gerade gekämpft.
Um in den Formatierungsprozess eingreifen zu können hab ich das PDF mit der Debug Option in ePub konvertiert. Da bleiben dann die Zwischenstufen in dem Debug Pfad liegen.
Da findet man dann die Verzeichnisse:
input, parsed, structure, processed
In dem index.html File im processed ordner hab ich dann die mit einem Perl Einzeiler die Absatzenden rausgeschmissen, die nicht mit einem Punkt enden.
also etwa so:
Code:
perl -ne 'if (m/^(.+ )<\/p><p class="calibre2">/){ if ( $1 =~ /\.\s+$/){ print $_} else { print $1} }' index.html > index_no_abs.html
Da bei der Methode der html Kopf und Fußbereich etwas leidet hab ich den Teil einfach aus dem Original genommen, dann die Mitte aus der konvertierten dazwischengeklebt.
Dann die Spieldateien aus dem Verzeichnis wieder löschen, das ganze Verzeichnis zippen und in in Calibre als neues Dokument einlesen und als ePub konvertieren.
Fertig sind die Absätze mit Fließtext.
Ich denke, das sich sicher relativ einfach über ein Plugin lösen lasst.
gRuss Ralf