View Full Version : Calibre: fehlende Buchstaben bei Umwandlung pdf => epub


Zel
06-05-2010, 03:25 AM
Hallo zusammen,

ich habe einige eBooks mit Calibre von pdf in epubs umgewandelt, welches (ohne große Einstellungen vorgenommen zu haben (außer: 5" Lesegerät), ziemlich zufriedenstellend funktioniert hat.

Bei zwei Büchern (und wahrscheinlich mehr der gleichen Reihe..) fehlen allerdings häufig Buchstaben nach der Umwandlung, die im Original PDF noch vorhanden waren. Dies scheint vor allem die Buchstabenkombination "ll" zu betroffen, so dass zum Beispiel der Satz

"Hallo, alles klar?" zu "Hal o, al es klar?" wird, wobei der fehlende Buchstabe durch ein Leerzeichen ersetzt wird. Mit den "l"s trat es am häufigsten (=ständig) auf, aber es passierte auch tlw mit anderen Buchstaben.

Kennt jmd das Problem? Weiß jmd eine Lösung?
Benutze die aktuellste Calibre Version..

Danke und Gruß - Zel

netseeker
06-05-2010, 09:08 AM
Ich kenne das Problem, habe allerdings keine reine Calibre-Lösung dafür. Ich importiere solche PDF's vorher in den Mobipocket Creator und importiere dann die resultierende, interne HTML-Datei des Creators zur Umwandlung in Calibre. Da bleiben die Buchstaben dann eigentlich immer erhalten.

Zel
06-05-2010, 09:51 AM
Danke für den Tipp!
Konnte den Mobipocket creator leider nur für PCs finden. Gibts eine ähnliche Lösung auch für Macs?

bzw. geht es nur über den Umweg: PDF => HTML => epub (oder hab ich das falsch verstanden)?

mtravellerh
06-07-2010, 02:29 AM
Danke für den Tipp!
Konnte den Mobipocket creator leider nur für PCs finden. Gibts eine ähnliche Lösung auch für Macs?

bzw. geht es nur über den Umweg: PDF => HTML => epub (oder hab ich das falsch verstanden)?

Ja, mobipocket hat es leider nicht für nötig befunden, den Creator auch für Mac zu konvertieren.

gulu-gulu
06-07-2010, 04:33 AM
Nunja, man kann auch den Inhalt des pdfs markieren, kopieren und z.B. in Openoffice einfügen. Als rtf gespeichert lässt sich das gut von calibre übernehmen. Allerdings gehen dabei natürlich Kapitel usw. verloren. Für reine-text-pdfs aber eine rel. einfache/schnelle Lösung..

mtravellerh
06-07-2010, 04:37 AM
Nunja, man kann auch den Inhalt des pdfs markieren, kopieren und z.B. in Openoffice einfügen. Als rtf gespeichert lässt sich das gut von calibre übernehmen. Allerdings gehen dabei natürlich Kapitel usw. verloren. Für reine-text-pdfs aber eine rel. einfache/schnelle Lösung..

Ja, schon richtig. Aber es geht halt einiges an Format flöten, wie man immer sich auch anstellt. Gott sei Dank kann man die meisten Romane leicht mit meinem PoketBook lesen. Bei A4-Seiten braucht man schon mal den Reflow aber im Grossen und Ganzen geht's.

Manichean
06-07-2010, 04:59 AM
"Hallo, alles klar?" zu "Hal o, al es klar?" wird, wobei der fehlende Buchstabe durch ein Leerzeichen ersetzt wird. Mit den "l"s trat es am häufigsten (=ständig) auf, aber es passierte auch tlw mit anderen Buchstaben.
Hm, das klingt ein bißchen nach Problemen mit Ligaturen. Calibre hat seit Kurzem dafür Optionen bei der Konvertierung. Probier das doch mal aus.

Zel
06-07-2010, 12:13 PM
Ja, schon richtig. Aber es geht halt einiges an Format flöten, wie man immer sich auch anstellt. Gott sei Dank kann man die meisten Romane leicht mit meinem PoketBook lesen. Bei A4-Seiten braucht man schon mal den Reflow aber im Grossen und Ganzen geht's.

Generell bin ich auch von der guten pdf-Darstellung meines PB überrascht, aber ich ich lese trotzdem meine Bücher lieber im eBook Format (u.a. weil das Blättern so deutlich schneller geht und ich lieber die Schriftgröße einstelle, als mit dem Reflow-Modus rumzuspielen..) Manche pdf-Bücher (die für den Reflow + epub-Konvertierung nicht geeignet sind) lassen sich dennoch erstaunlich gut auf dem 5"er lesen!

Hm, das klingt ein bißchen nach Problemen mit Ligaturen. Calibre hat seit Kurzem dafür Optionen bei der Konvertierung. Probier das doch mal aus.

Das hört sich super an! Leider konnte ich den Punkt bei der Konvertierung nicht finden.. wo genau ist der?

Manichean
06-07-2010, 05:28 PM
Das hört sich super an! Leider konnte ich den Punkt bei der Konvertierung nicht finden.. wo genau ist der?
Das ist eine standardmäßig aktivierte, seit 0.6.54 verfügbare Option. Zu finden in den Einstellungen unter Konvertierung im Tab Layout, die Option heißt "Ligaturen beibehalten" und sollte deaktiviert sein.

EDIT: Ist natürlich genauso in den Konvertierungseinstellungen bei jedem einzelnen Buch zu finden.

Zel
06-08-2010, 01:50 AM
Das ist eine standardmäßig aktivierte, seit 0.6.54 verfügbare Option. Zu finden in den Einstellungen unter Konvertierung im Tab Layout, die Option heißt "Ligaturen beibehalten" und sollte deaktiviert sein.

EDIT: Ist natürlich genauso in den Konvertierungseinstellungen bei jedem einzelnen Buch zu finden.

Hallo Manichean,

irgendwie.. kann ich den Punkt trotzdem nicht finden. Habe Calibre-Version 0.7.1 - anbei ein screenshot.

Manichean
06-08-2010, 10:31 AM
Hallo Manichean,

irgendwie.. kann ich den Punkt trotzdem nicht finden. Habe Calibre-Version 0.7.1 - anbei ein screenshot.
Huh. Keine Ahnung. So siehts bei mir aus...

Zel
06-08-2010, 10:36 AM
mmh.. gibt es denn unterschiedliche Versionen für Mac und PC? Ansonsten kann ich mir das nämlich nicht erklären.. :(

Duglum
06-08-2010, 11:03 AM
Ich habe es mit und ohne die Option probiert, leider werden die Ligaturen in beiden Fällen nicht konvertiert, so dass immer nur ein Buchstabe zu sehen ist. Ich habe einen entsprechenden Thread mit Beispiel-Dateien im Calibre-Forum erstellt (klick mich (http://www.mobileread.com/forums/showthread.php?t=86216)), jetzt heisst es wohl abwarten.

Duglum

Edit: kovid hat schon geantwortet:

That pdf uses a technique to encode ligatures that will only be supported by the upcoming new pdf conversion engine. (Currently ligature removal depends on the pdf to html engine correctly detecting ligatures, which works for some, but not all pdf files)

Also funktioniert es nur bei bestimmten PDFs noch nicht, und das Problem wird irgendwann in einer zukünftigen PDF-Umwandlungs-Engine behoben.

Zel
06-10-2010, 04:56 AM
Also funktioniert es nur bei bestimmten PDFs noch nicht, und das Problem wird irgendwann in einer zukünftigen PDF-Umwandlungs-Engine behoben.

mmh, dann warte ich mal gespannt, in welcher FW-Version dieses Problem behoben wird.. wenn du mehr weisst @Duglun, kannst du uns ja vielleicht wieder hier auf dem Laufenden halten, da ich nicht bei jeder FW-Aktualisierung von Calibre meine pdfs neu umwandeln möchte, um zu schauen, ob der Fehler behoben ist.. ;-)
Danke auf jeden Fall für die Info!