04-24-2012, 10:44 AM | #1 |
Zealot
Posts: 148
Karma: 1126
Join Date: Jan 2010
Location: Hamburg, http://osm.org/go/0HoMJR_kW--?layers=B000FFF
Device: Handera 330, bookeen gen 3(broken), PocketBook 360°, 360° Plus
|
Massenkonvertierung von PDF Dateien
Ich habe über 6800 PDF Dateien, die ich gerne nach EPUB oder (X)HTML Dateien konvertieren würde.
Glücklicherweise ist der Inhalt reiner formatierter Text. Weniger gut, die Artikel haben Kopf und Fußzeilen. Dazu noch Fußnoten und zweispaltiges Layout. Der Konverter müsste unbedingt Batchfähig sein. Wenn die die Formatierung nicht 100% rüberkommt wäre es auch nicht so schlimm. Als OS habe ich XP oder Ubuntu. Hat irgendjemand eine Idee ob es so ein Tool gibt? Gruß Jacques |
05-02-2012, 04:40 PM | #2 |
Zealot
Posts: 148
Karma: 1126
Join Date: Jan 2010
Location: Hamburg, http://osm.org/go/0HoMJR_kW--?layers=B000FFF
Device: Handera 330, bookeen gen 3(broken), PocketBook 360°, 360° Plus
|
Da seit etlichen Tagen keine Antwort gekommen ist habe ich den Verdacht, das man vermutet, das ich irgendwelche Raub PDF Dateien konvertieren möchte.
Das ist nicht der Fall. Es handelt sich um eine gekaufte DVD aus dem Blätter Verlag mit den Artikeln aus 'Blätter für deutsche und internationale Politik'. Die hätte ich gerne verschlagwortet und in einem Format, das ich sie mit meinem PocketBook 360+ gut lesen kann. Gruß Jacques |
Advert | |
|
05-02-2012, 11:33 PM | #3 |
Harmless idiot
Posts: 3,411
Karma: 2154829
Join Date: Nov 2010
Location: Zuhause
Device: PB622, Nexus7, Sony PRS 350, Tolino und nur noch wenig toter Baum:(
|
Hallo Jacques_N,
Ich glaube eine fehlende Antwort liegt weniger am Unterstellen böser Absicht als an der Nichtexistenz eines Konverterprogrammes das deinen Anforderungen entspricht. Meines Wissens ist Calibre der einzige Batch-fähige Konverter aber wohl nicht so geeignet. Da wirst du dich wohl mal zwei-drei Tage hinsetzen müssen PDFtoEPUB oder den MobiCreator bemühen müssen |
05-15-2012, 08:16 AM | #4 |
Member
Posts: 18
Karma: 5010
Join Date: Jul 2008
Device: Cybook Odyssey HD FrontLight, Onxy Boox i86ML+
|
Du könntest Finereader nehmen (das gibts auch für wenig Geld in einer nicht ganz aktuellen Version) und damit die PDFs in Text, RTF, HTML oder sowas umwandeln.
|
05-15-2012, 09:04 AM | #5 | |
Banned
Posts: 48
Karma: 81310
Join Date: Jan 2012
Device: several
|
Quote:
Ich habe gestern nach langer Zeit mal wieder Omnipage 18 verwendet - normalerweise ziehe ich ABBYY vor. Bei Omnipage gibt es ein Batch-Zusatzprogramm, das jede Menge kann. Benutzt habe ich es noch nicht. Vielleicht gibt es eine Testversion zum Ausprobieren. Bei ABBYY geht Massenkonvertierung auch mit kleineren Mengen, aber dann wird alles in ein einziges File geschrieben. So oder so jede Menge Arbeit. Verschlagwortet in dem Sinn, dass dir das was bringt(Hyperlinks) wird ohnehin nicht gehen - vermute ich ... |
|
Advert | |
|
05-16-2012, 11:04 AM | #6 |
Banned
Posts: 48
Karma: 81310
Join Date: Jan 2012
Device: several
|
PDF to ePub Converter
Key Features: Converts PDF into ePub format. EPub format can be read on most readers. Zoom the font size, zoom the image DPI. Supports all PDF versions. Removes PDF page header and footer. Supports batch conversion. Professional version Supports conversion of tables and epub editing before output. Kostet allerdings ... |
05-16-2012, 11:51 AM | #7 | |
Harmless idiot
Posts: 3,411
Karma: 2154829
Join Date: Nov 2010
Location: Zuhause
Device: PB622, Nexus7, Sony PRS 350, Tolino und nur noch wenig toter Baum:(
|
Quote:
|
|
05-16-2012, 03:04 PM | #8 |
Banned
Posts: 48
Karma: 81310
Join Date: Jan 2012
Device: several
|
Da gibt es wohl ca. 5 verschiedene Software, die alle die gleiche oder eine ähnliche Bezeichnung haben. Das Zitat ist von Dongsoft ...
|
05-17-2012, 04:17 AM | #9 |
Harmless idiot
Posts: 3,411
Karma: 2154829
Join Date: Nov 2010
Location: Zuhause
Device: PB622, Nexus7, Sony PRS 350, Tolino und nur noch wenig toter Baum:(
|
|
05-18-2012, 02:49 AM | #10 |
Zealot
Posts: 148
Karma: 1126
Join Date: Jan 2010
Location: Hamburg, http://osm.org/go/0HoMJR_kW--?layers=B000FFF
Device: Handera 330, bookeen gen 3(broken), PocketBook 360°, 360° Plus
|
Ersteinmal Danke für die Antworten.
Finereader: Benutze ich schon seit vielen Jahren mit voller Zufriedenheit und habe schon weit über hundert Bücher eingescannt. PDFs habe ich damit auch schon mit Erfolg konvertiert. Leider ist das Programm nicht batchfähig (zumindestens meine Version 6). Jedes Dokument einzeln zu konvertieren wäre eine Aufgabe von vielen langen Winterabenden PdfToHtml: War schon auf meinem Rechner, ohne das ich es wusste. Konvertiert meine PDFs rasant und mit guter Qualität. Ich könnte ein Script schreiben das mit in einem Rutsch alle Dokumente konvertiert. ABER das erzeugte HTML ist für die Verwendung für einen EBookreader völlig ungeeignet, da es allen Inhalt mit absoluten Positionen versieht. Damit kommt selbst Sigil nicht klar. Alternativ könnte man das Dokument auch als XML ausgeben, das hätte den Vorteil das man es hinterher besser parsen und in ein brauchbares HTML wandeln. So ein Konverterscript wäre allerdings auch nicht trivial zu programmieren... Was die anderen Programme anbelangt, die sind soviel ich weiß auch nicht Kommandozeilen geeignet, oder irre ich mich da? Ich werde mich mal irgendwann mit der PdfToHtml -> XML -> HTML Variante versuchen, habe aber nicht viel Hoffnung. Schöne Grüße Jacques |
05-18-2012, 03:25 PM | #11 | |
Banned
Posts: 48
Karma: 81310
Join Date: Jan 2012
Device: several
|
Quote:
"Bei Omnipage gibt es ein Batch-Zusatzprogramm, das jede Menge kann. Benutzt habe ich es noch nicht. Vielleicht gibt es eine Testversion zum Ausprobieren." |
|
05-18-2012, 04:45 PM | #12 |
Linux User
Posts: 2,279
Karma: 6123806
Join Date: Sep 2010
Location: Heidelberg, Germany
Device: none
|
pdftohtml ist schon okay, allerdings solltest du auch sed oder awk beherrschen, damit du die HTML-Ausgabe zurechtbiegen kannst an deine Bedürfnisse. Ich hatte z.B. eine PDF-Datei bei der ich <br><br> zu <p> verwandeln musste und alleinstehende <br> zu Leerzeichen, damit die Formatierung halbwegs stimmt. Calibre benutzt ja auch pdftohtml, war damit aber überfordert und ich mache sowas schneller selber mit sed, als bei Calibre durch die Konfigurationsoptionen durchzusteigen.
|
05-19-2012, 02:55 PM | #13 |
BioReader
Posts: 292
Karma: 42568
Join Date: Apr 2009
Location: Germany
Device: Various
|
Ein Tipp - der MobiPocketReader importiert klaglos pdf Dateien und gibt sie ohne großes Federlesen als prc Format in "My Ebooks" aus. Der reader.exe lässt sich auf der Kommandozeile mit <reader.exe abcdef.pdf> aufrufen, danach verrichtet er sein Werk (und nicht mal schlecht). Er benutzt dafür pdf2xml.exe. prc in epub zu wandeln ist mit calibre kein Thema.
Wenn du mit Batch Dateien vertraut bist, kannst du den ganzen Aufruf ein paar hundert Mal in die Batch Datei schreiben lassen (es gibt utilities, die ein Verzeichnis (mit den pdf) auslesen und in ein Textfile portieren!) und dann das Batchfile abarbeiten lassen. Käme auf einen Versuch an - geht schnell und das Ergebnis vom Mobilreader ist, wie gesagt, schon mal nicht schlecht. Sicher ist dann noch Nacharbeit angesagt. Klaus Last edited by kbaerwald; 05-19-2012 at 02:59 PM. |
05-20-2012, 04:29 AM | #14 | |
Grand Sorcerer
Posts: 5,584
Karma: 22735033
Join Date: Dec 2010
Device: Kindle PW2
|
Quote:
Wer Calibre installiert hat, kann die folgende Batch-Datei verwenden, die alle PDF-Dateien in einem Ordner in ePubs konvertiert: Code:
FOR %%f IN ("*.pdf") DO ( ebook-convert "%%~nf.pdf" "%%~nf.ePub" --enable-heuristics --no-default-epub-cover --pretty-print --dont-split-on-page-breaks ) Mit Mobipocket Reader konvertierte PDF-Dateien sehen allerdings besser aus, und da Mobipocket Reader Drag & Drop unterstützt, könnte man auch alle PDF-Dateien im Explorer auswählen und dann auf das Mobipocket Reader-Fenster ziehen. Die so erhaltenen PRC-Dateien könnte man dann mit derselben Batchdatei konvertieren, wenn man die folgenden Zeilen von: Code:
FOR %%f IN ("*.pdf") DO ( ebook-convert "%%~nf.pdf" "%%~nf.ePub" --enable-heuristics --no-default-epub-cover --pretty-print --dont-split-on-page-breaks Code:
FOR %%f IN ("*.prc") DO ( ebook-convert "%%~nf.prc" "%%~nf.ePub" --enable-heuristics --no-default-epub-cover --pretty-print --dont-split-on-page-breaks Last edited by Doitsu; 05-20-2012 at 04:50 AM. |
|
05-20-2012, 04:35 AM | #15 |
BioReader
Posts: 292
Karma: 42568
Join Date: Apr 2009
Location: Germany
Device: Various
|
Hallo doitsu
schöne Lösung |
|
Similar Threads | ||||
Thread | Thread Starter | Forum | Replies | Last Post |
benutzerdefinierte Meta Tags bei PDF Dateien | Thommynat0r | Software | 1 | 03-04-2012 05:40 AM |
Qualität von Amazons PDF-Konverter | Alaska | Amazon Kindle | 3 | 07-14-2011 08:03 AM |
PDF Dateien zerschnibbeln und wieder zusammenfügen - für Sony PRS 600 optimieren | Shyne | Software | 6 | 04-23-2010 04:15 AM |
PDF-Dateien auf dem PocketBook | Ulli | PocketBook | 10 | 02-27-2010 03:34 PM |
PDF Anzeige von eBook Readern | Josch91 | Erste Hilfe | 8 | 04-18-2009 04:02 PM |