View Full Version : Calibre: Duplikate zusammenführen


DerWossi
12-28-2009, 06:06 PM
Hallo Gemeinde,

ich konvertiere fleissig einen Teil meiner Bücher ins ePub Format. Da ich dies nicht mit Calibre erledige (PDF's mit zwei Spalten...), bekomme ich damit jedesmal ein Duplikat in meiner Sammlung. Dies erkennt Calibre pflichtgemäß und fragt ob ich das so haben möchte. Es ist aber nicht schlau genug diese Duplikate folgerichtig als ein Buch zu betrachten :smack:

Wie löst Ihr dieses Dilemma auf?

Bisher helfe ich mir indem ich das "Original" lösche, und dann alle Formate als ein Buch wieder einlese. Dabei müssen aber u.U. die Metadaten korrigiert werden...

Vielleicht übersehe ich etwas?

netseeker
12-28-2009, 08:23 PM
Ok, nur damit ich das richtig verstehe:

Du hast das Buch zumindest als PDF oder auch in mehreren Formaten bereits in Calibre importiert,
dann erstellst Du außerhalb von Calibre aus dem PDF (welches Calibre bereits kennt) ein ePub,
dann importierst Du das ePub in Calibre?

Wenn das so richtig ist, dann wäre der einzige Fehler dieser:
Anstatt das ePub zu importieren, wählst Du den bereits in Calibre vorhandenen Titel (für das PDF), wechselst in die Metadaten und fügst dort dann das ePub hinzu.

DerWossi
12-29-2009, 05:25 AM
Das war jetzt entschieden zu einfach...

Unter den Meta-Informationen habe ich offenbar nie nach so einer Option gesucht und deshalb auch den schicken Button mit dem Text "Ein neues Format für dieses Buch zur Datenbank hinzufügen" übersehen.

Danke Netseeker!

mtravellerh
12-29-2009, 05:53 AM
Ich werde das in meinen Calibre-Führer integrieren. Leider wissen viele nicht von dieser Möglichkeit. Ausserdem ist es sogar möglich, ein leeres Buch zu erstellen und dann die entsprechenden Bookfiles erst später reinzusetzen!

netseeker
12-29-2009, 06:11 AM
Das war jetzt entschieden zu einfach...

Unter den Meta-Informationen habe ich offenbar nie nach so einer Option gesucht und deshalb auch den schicken Button mit dem Text "Ein neues Format für dieses Buch zur Datenbank hinzufügen" übersehen.
Keine Sorge Du bist nicht der Erste, der da drüber gestolpert ist. Das die unterschiedlichen Formate unter "Metadaten" versteckt sind, ist vielleicht nicht gerade so glücklich gewählt.
Darf ich fragen mit was Du die ePubs außerhalb von Calibre aus den mehrspaltigen PDF's erstellst?

DerWossi
12-29-2009, 06:50 PM
Darf ich fragen mit was Du die ePubs außerhalb von Calibre aus den mehrspaltigen PDF's erstellst?

Ich probiere noch mit verschiedenen Kombinationen...
Mein momentaner Lieblingsworkflow ist:

Cover extrahieren: pdftohtml (http://pdftohtml.sourceforge.net/)
Text extrahieren: pdftotext (http://www.foolabs.com/xpdf/download.html) -raw
Text in Kapitel aufteilen und bereinigen: notepad++ (http://notepad-plus.sourceforge.net/de/site.htm)
Kapitel in einem Projekt zusammenführen, Meta-Daten, TOC und Cover: eCub (http://www.juliansmart.com/ecub)
Formatierung: Kompozer (http://kompozer.net/)


Die Formatierung mache ich bewusst erst nachdem ich die Kapitel im eCub importiert habe, und nicht schon vorher im Rohtext. So läuft das ePub am saubersten durch den EpubCheck (http://code.google.com/p/epubcheck/).

Damit bekomme ich meine zweispaltigen PDF's mittlerweile ganz gut (und zügig) umgebaut.

mtravellerh
12-30-2009, 01:39 PM
Ich probiere noch mit verschiedenen Kombinationen...
Mein momentaner Lieblingsworkflow ist:

Cover extrahieren: pdftohtml (http://pdftohtml.sourceforge.net/)
Text extrahieren: pdftotext (http://www.foolabs.com/xpdf/download.html) -raw
Text in Kapitel aufteilen und bereinigen: notepad++ (http://notepad-plus.sourceforge.net/de/site.htm)
Kapitel in einem Projekt zusammenführen, Meta-Daten, TOC und Cover: eCub (http://www.juliansmart.com/ecub)
Formatierung: Kompozer (http://kompozer.net/)


Die Formatierung mache ich bewusst erst nachdem ich die Kapitel im eCub importiert habe, und nicht schon vorher im Rohtext. So läuft das ePub am saubersten durch den EpubCheck (http://code.google.com/p/epubcheck/).

Damit bekomme ich meine zweispaltigen PDF's mittlerweile ganz gut (und zügig) umgebaut.

Tipp für 4 und 5: Sigil