Register Guidelines E-Books Today's Posts Search

Go Back   MobileRead Forums > Non-English Discussions > Deutsches Forum > Erste Hilfe

Notices

Reply
 
Thread Tools Search this Thread
Old 04-24-2012, 10:44 AM   #1
Jacques_N
Zealot
Jacques_N can extract oil from cheeseJacques_N can extract oil from cheeseJacques_N can extract oil from cheeseJacques_N can extract oil from cheeseJacques_N can extract oil from cheeseJacques_N can extract oil from cheeseJacques_N can extract oil from cheeseJacques_N can extract oil from cheeseJacques_N can extract oil from cheese
 
Jacques_N's Avatar
 
Posts: 148
Karma: 1126
Join Date: Jan 2010
Location: Hamburg, http://osm.org/go/0HoMJR_kW--?layers=B000FFF
Device: Handera 330, bookeen gen 3(broken), PocketBook 360°, 360° Plus
Massenkonvertierung von PDF Dateien

Ich habe über 6800 PDF Dateien, die ich gerne nach EPUB oder (X)HTML Dateien konvertieren würde.
Glücklicherweise ist der Inhalt reiner formatierter Text. Weniger gut, die Artikel haben Kopf und Fußzeilen. Dazu noch Fußnoten und zweispaltiges Layout.

Der Konverter müsste unbedingt Batchfähig sein. Wenn die die Formatierung nicht 100% rüberkommt wäre es auch nicht so schlimm.
Als OS habe ich XP oder Ubuntu.

Hat irgendjemand eine Idee ob es so ein Tool gibt?

Gruß
Jacques
Jacques_N is offline   Reply With Quote
Old 05-02-2012, 04:40 PM   #2
Jacques_N
Zealot
Jacques_N can extract oil from cheeseJacques_N can extract oil from cheeseJacques_N can extract oil from cheeseJacques_N can extract oil from cheeseJacques_N can extract oil from cheeseJacques_N can extract oil from cheeseJacques_N can extract oil from cheeseJacques_N can extract oil from cheeseJacques_N can extract oil from cheese
 
Jacques_N's Avatar
 
Posts: 148
Karma: 1126
Join Date: Jan 2010
Location: Hamburg, http://osm.org/go/0HoMJR_kW--?layers=B000FFF
Device: Handera 330, bookeen gen 3(broken), PocketBook 360°, 360° Plus
Da seit etlichen Tagen keine Antwort gekommen ist habe ich den Verdacht, das man vermutet, das ich irgendwelche Raub PDF Dateien konvertieren möchte.
Das ist nicht der Fall. Es handelt sich um eine gekaufte DVD aus dem Blätter Verlag mit den Artikeln aus 'Blätter für deutsche und internationale Politik'.
Die hätte ich gerne verschlagwortet und in einem Format, das ich sie mit meinem PocketBook 360+ gut lesen kann.

Gruß
Jacques
Jacques_N is offline   Reply With Quote
Old 05-02-2012, 11:33 PM   #3
troll05
Harmless idiot
troll05 ought to be getting tired of karma fortunes by now.troll05 ought to be getting tired of karma fortunes by now.troll05 ought to be getting tired of karma fortunes by now.troll05 ought to be getting tired of karma fortunes by now.troll05 ought to be getting tired of karma fortunes by now.troll05 ought to be getting tired of karma fortunes by now.troll05 ought to be getting tired of karma fortunes by now.troll05 ought to be getting tired of karma fortunes by now.troll05 ought to be getting tired of karma fortunes by now.troll05 ought to be getting tired of karma fortunes by now.troll05 ought to be getting tired of karma fortunes by now.
 
troll05's Avatar
 
Posts: 3,411
Karma: 2154829
Join Date: Nov 2010
Location: Zuhause
Device: PB622, Nexus7, Sony PRS 350, Tolino und nur noch wenig toter Baum:(
Hallo Jacques_N,

Ich glaube eine fehlende Antwort liegt weniger am Unterstellen böser Absicht als an der Nichtexistenz eines Konverterprogrammes das deinen Anforderungen entspricht.

Meines Wissens ist Calibre der einzige Batch-fähige Konverter aber wohl nicht so geeignet.
Da wirst du dich wohl mal zwei-drei Tage hinsetzen müssen PDFtoEPUB oder den MobiCreator bemühen müssen
troll05 is offline   Reply With Quote
Old 05-15-2012, 08:16 AM   #4
sleepyDragon
Member
sleepyDragon , Klaatu Barada Niktu!sleepyDragon , Klaatu Barada Niktu!sleepyDragon , Klaatu Barada Niktu!sleepyDragon , Klaatu Barada Niktu!sleepyDragon , Klaatu Barada Niktu!sleepyDragon , Klaatu Barada Niktu!sleepyDragon , Klaatu Barada Niktu!sleepyDragon , Klaatu Barada Niktu!sleepyDragon , Klaatu Barada Niktu!sleepyDragon , Klaatu Barada Niktu!sleepyDragon , Klaatu Barada Niktu!
 
sleepyDragon's Avatar
 
Posts: 18
Karma: 5010
Join Date: Jul 2008
Device: Cybook Odyssey HD FrontLight, Onxy Boox i86ML+
Du könntest Finereader nehmen (das gibts auch für wenig Geld in einer nicht ganz aktuellen Version) und damit die PDFs in Text, RTF, HTML oder sowas umwandeln.
sleepyDragon is offline   Reply With Quote
Old 05-15-2012, 09:04 AM   #5
geronimo
Banned
geronimo doesn't feed trollsgeronimo doesn't feed trollsgeronimo doesn't feed trollsgeronimo doesn't feed trollsgeronimo doesn't feed trollsgeronimo doesn't feed trollsgeronimo doesn't feed trollsgeronimo doesn't feed trollsgeronimo doesn't feed trollsgeronimo doesn't feed trollsgeronimo doesn't feed trolls
 
Posts: 48
Karma: 81310
Join Date: Jan 2012
Device: several
Quote:
Originally Posted by Jacques_N View Post
Da seit etlichen Tagen keine Antwort gekommen ist habe ich den Verdacht, das man vermutet, das ich irgendwelche Raub PDF Dateien konvertieren möchte.
Das ist nicht der Fall. Es handelt sich um eine gekaufte DVD aus dem Blätter Verlag mit den Artikeln aus 'Blätter für deutsche und internationale Politik'.
Die hätte ich gerne verschlagwortet und in einem Format, das ich sie mit meinem PocketBook 360+ gut lesen kann.

Gruß
Jacques
Wen juckt das schon? Ohne Antwort kann man schlecht antworten.
Ich habe gestern nach langer Zeit mal wieder Omnipage 18 verwendet - normalerweise ziehe ich ABBYY vor.
Bei Omnipage gibt es ein Batch-Zusatzprogramm, das jede Menge kann. Benutzt habe ich es noch nicht. Vielleicht gibt es eine Testversion zum Ausprobieren.

Bei ABBYY geht Massenkonvertierung auch mit kleineren Mengen, aber dann wird alles in ein einziges File geschrieben.

So oder so jede Menge Arbeit.

Verschlagwortet in dem Sinn, dass dir das was bringt(Hyperlinks) wird ohnehin nicht gehen - vermute ich ...
geronimo is offline   Reply With Quote
Old 05-16-2012, 11:04 AM   #6
geronimo
Banned
geronimo doesn't feed trollsgeronimo doesn't feed trollsgeronimo doesn't feed trollsgeronimo doesn't feed trollsgeronimo doesn't feed trollsgeronimo doesn't feed trollsgeronimo doesn't feed trollsgeronimo doesn't feed trollsgeronimo doesn't feed trollsgeronimo doesn't feed trollsgeronimo doesn't feed trolls
 
Posts: 48
Karma: 81310
Join Date: Jan 2012
Device: several
PDF to ePub Converter


Key Features:
Converts PDF into ePub format.
EPub format can be read on most readers.
Zoom the font size, zoom the image DPI.
Supports all PDF versions.
Removes PDF page header and footer.
Supports batch conversion.
Professional version Supports conversion of tables and epub editing before output.

Kostet allerdings ...
geronimo is offline   Reply With Quote
Old 05-16-2012, 11:51 AM   #7
troll05
Harmless idiot
troll05 ought to be getting tired of karma fortunes by now.troll05 ought to be getting tired of karma fortunes by now.troll05 ought to be getting tired of karma fortunes by now.troll05 ought to be getting tired of karma fortunes by now.troll05 ought to be getting tired of karma fortunes by now.troll05 ought to be getting tired of karma fortunes by now.troll05 ought to be getting tired of karma fortunes by now.troll05 ought to be getting tired of karma fortunes by now.troll05 ought to be getting tired of karma fortunes by now.troll05 ought to be getting tired of karma fortunes by now.troll05 ought to be getting tired of karma fortunes by now.
 
troll05's Avatar
 
Posts: 3,411
Karma: 2154829
Join Date: Nov 2010
Location: Zuhause
Device: PB622, Nexus7, Sony PRS 350, Tolino und nur noch wenig toter Baum:(
Quote:
Originally Posted by geronimo View Post
PDF to ePub Converter


Key Features:
Converts PDF into ePub format.
EPub format can be read on most readers.
Zoom the font size, zoom the image DPI.
Supports all PDF versions.
Removes PDF page header and footer.
Supports batch conversion.
Professional version Supports conversion of tables and epub editing before output.

Kostet allerdings ...
...und die Ergebnisse vom MobiPocket Creator sind deutlich besser, das Entfernen von Kopf und Fusszeile muss pro Format manuell eingestellt werden
troll05 is offline   Reply With Quote
Old 05-16-2012, 03:04 PM   #8
geronimo
Banned
geronimo doesn't feed trollsgeronimo doesn't feed trollsgeronimo doesn't feed trollsgeronimo doesn't feed trollsgeronimo doesn't feed trollsgeronimo doesn't feed trollsgeronimo doesn't feed trollsgeronimo doesn't feed trollsgeronimo doesn't feed trollsgeronimo doesn't feed trollsgeronimo doesn't feed trolls
 
Posts: 48
Karma: 81310
Join Date: Jan 2012
Device: several
Quote:
Originally Posted by troll05 View Post
...und die Ergebnisse vom MobiPocket Creator sind deutlich besser, das Entfernen von Kopf und Fusszeile muss pro Format manuell eingestellt werden
Da gibt es wohl ca. 5 verschiedene Software, die alle die gleiche oder eine ähnliche Bezeichnung haben. Das Zitat ist von Dongsoft ...
geronimo is offline   Reply With Quote
Old 05-17-2012, 04:17 AM   #9
troll05
Harmless idiot
troll05 ought to be getting tired of karma fortunes by now.troll05 ought to be getting tired of karma fortunes by now.troll05 ought to be getting tired of karma fortunes by now.troll05 ought to be getting tired of karma fortunes by now.troll05 ought to be getting tired of karma fortunes by now.troll05 ought to be getting tired of karma fortunes by now.troll05 ought to be getting tired of karma fortunes by now.troll05 ought to be getting tired of karma fortunes by now.troll05 ought to be getting tired of karma fortunes by now.troll05 ought to be getting tired of karma fortunes by now.troll05 ought to be getting tired of karma fortunes by now.
 
troll05's Avatar
 
Posts: 3,411
Karma: 2154829
Join Date: Nov 2010
Location: Zuhause
Device: PB622, Nexus7, Sony PRS 350, Tolino und nur noch wenig toter Baum:(
Quote:
Originally Posted by geronimo View Post
Da gibt es wohl ca. 5 verschiedene Software, die alle die gleiche oder eine ähnliche Bezeichnung haben. Das Zitat ist von Dongsoft ...
Dann nehme ich es zurück, mein PDFtoEPUB ist von DNAML
troll05 is offline   Reply With Quote
Old 05-18-2012, 02:49 AM   #10
Jacques_N
Zealot
Jacques_N can extract oil from cheeseJacques_N can extract oil from cheeseJacques_N can extract oil from cheeseJacques_N can extract oil from cheeseJacques_N can extract oil from cheeseJacques_N can extract oil from cheeseJacques_N can extract oil from cheeseJacques_N can extract oil from cheeseJacques_N can extract oil from cheese
 
Jacques_N's Avatar
 
Posts: 148
Karma: 1126
Join Date: Jan 2010
Location: Hamburg, http://osm.org/go/0HoMJR_kW--?layers=B000FFF
Device: Handera 330, bookeen gen 3(broken), PocketBook 360°, 360° Plus
Ersteinmal Danke für die Antworten.

Finereader: Benutze ich schon seit vielen Jahren mit voller Zufriedenheit und habe schon weit über hundert Bücher eingescannt. PDFs habe ich damit auch schon mit Erfolg konvertiert. Leider ist das Programm nicht batchfähig (zumindestens meine Version 6). Jedes Dokument einzeln zu konvertieren wäre eine Aufgabe von vielen langen Winterabenden

PdfToHtml: War schon auf meinem Rechner, ohne das ich es wusste. Konvertiert meine PDFs rasant und mit guter Qualität. Ich könnte ein Script schreiben das mit in einem Rutsch alle Dokumente konvertiert.
ABER das erzeugte HTML ist für die Verwendung für einen EBookreader völlig ungeeignet, da es allen Inhalt mit absoluten Positionen versieht. Damit kommt selbst Sigil nicht klar.
Alternativ könnte man das Dokument auch als XML ausgeben, das hätte den Vorteil das man es hinterher besser parsen und in ein brauchbares HTML wandeln. So ein Konverterscript wäre allerdings auch nicht trivial zu programmieren...

Was die anderen Programme anbelangt, die sind soviel ich weiß auch nicht Kommandozeilen geeignet, oder irre ich mich da?

Ich werde mich mal irgendwann mit der PdfToHtml -> XML -> HTML Variante versuchen, habe aber nicht viel Hoffnung.

Schöne Grüße
Jacques
Jacques_N is offline   Reply With Quote
Old 05-18-2012, 03:25 PM   #11
geronimo
Banned
geronimo doesn't feed trollsgeronimo doesn't feed trollsgeronimo doesn't feed trollsgeronimo doesn't feed trollsgeronimo doesn't feed trollsgeronimo doesn't feed trollsgeronimo doesn't feed trollsgeronimo doesn't feed trollsgeronimo doesn't feed trollsgeronimo doesn't feed trollsgeronimo doesn't feed trolls
 
Posts: 48
Karma: 81310
Join Date: Jan 2012
Device: several
Quote:
Originally Posted by Jacques_N View Post
Ersteinmal Danke für die Antworten.

Finereader: Benutze ich schon seit vielen Jahren mit voller Zufriedenheit und habe schon weit über hundert Bücher eingescannt. PDFs habe ich damit auch schon mit Erfolg konvertiert. Leider ist das Programm nicht batchfähig (zumindestens meine Version 6). Jedes Dokument einzeln zu konvertieren wäre eine Aufgabe von vielen langen Winterabenden

PdfToHtml: War schon auf meinem Rechner, ohne das ich es wusste. Konvertiert meine PDFs rasant und mit guter Qualität. Ich könnte ein Script schreiben das mit in einem Rutsch alle Dokumente konvertiert.
ABER das erzeugte HTML ist für die Verwendung für einen EBookreader völlig ungeeignet, da es allen Inhalt mit absoluten Positionen versieht. Damit kommt selbst Sigil nicht klar.
Alternativ könnte man das Dokument auch als XML ausgeben, das hätte den Vorteil das man es hinterher besser parsen und in ein brauchbares HTML wandeln. So ein Konverterscript wäre allerdings auch nicht trivial zu programmieren...

Was die anderen Programme anbelangt, die sind soviel ich weiß auch nicht Kommandozeilen geeignet, oder irre ich mich da?

Ich werde mich mal irgendwann mit der PdfToHtml -> XML -> HTML Variante versuchen, habe aber nicht viel Hoffnung.

Schöne Grüße
Jacques
Und was ist damit?

"Bei Omnipage gibt es ein Batch-Zusatzprogramm, das jede Menge kann. Benutzt habe ich es noch nicht. Vielleicht gibt es eine Testversion zum Ausprobieren."
geronimo is offline   Reply With Quote
Old 05-18-2012, 04:45 PM   #12
frostschutz
Linux User
frostschutz ought to be getting tired of karma fortunes by now.frostschutz ought to be getting tired of karma fortunes by now.frostschutz ought to be getting tired of karma fortunes by now.frostschutz ought to be getting tired of karma fortunes by now.frostschutz ought to be getting tired of karma fortunes by now.frostschutz ought to be getting tired of karma fortunes by now.frostschutz ought to be getting tired of karma fortunes by now.frostschutz ought to be getting tired of karma fortunes by now.frostschutz ought to be getting tired of karma fortunes by now.frostschutz ought to be getting tired of karma fortunes by now.frostschutz ought to be getting tired of karma fortunes by now.
 
frostschutz's Avatar
 
Posts: 2,279
Karma: 6123806
Join Date: Sep 2010
Location: Heidelberg, Germany
Device: none
pdftohtml ist schon okay, allerdings solltest du auch sed oder awk beherrschen, damit du die HTML-Ausgabe zurechtbiegen kannst an deine Bedürfnisse. Ich hatte z.B. eine PDF-Datei bei der ich <br><br> zu <p> verwandeln musste und alleinstehende <br> zu Leerzeichen, damit die Formatierung halbwegs stimmt. Calibre benutzt ja auch pdftohtml, war damit aber überfordert und ich mache sowas schneller selber mit sed, als bei Calibre durch die Konfigurationsoptionen durchzusteigen.
frostschutz is offline   Reply With Quote
Old 05-19-2012, 02:55 PM   #13
kbaerwald
BioReader
kbaerwald understands when you whisper 'The dog barks at midnight.'kbaerwald understands when you whisper 'The dog barks at midnight.'kbaerwald understands when you whisper 'The dog barks at midnight.'kbaerwald understands when you whisper 'The dog barks at midnight.'kbaerwald understands when you whisper 'The dog barks at midnight.'kbaerwald understands when you whisper 'The dog barks at midnight.'kbaerwald understands when you whisper 'The dog barks at midnight.'kbaerwald understands when you whisper 'The dog barks at midnight.'kbaerwald understands when you whisper 'The dog barks at midnight.'kbaerwald understands when you whisper 'The dog barks at midnight.'kbaerwald understands when you whisper 'The dog barks at midnight.'
 
kbaerwald's Avatar
 
Posts: 292
Karma: 42568
Join Date: Apr 2009
Location: Germany
Device: Various
Ein Tipp - der MobiPocketReader importiert klaglos pdf Dateien und gibt sie ohne großes Federlesen als prc Format in "My Ebooks" aus. Der reader.exe lässt sich auf der Kommandozeile mit <reader.exe abcdef.pdf> aufrufen, danach verrichtet er sein Werk (und nicht mal schlecht). Er benutzt dafür pdf2xml.exe. prc in epub zu wandeln ist mit calibre kein Thema.

Wenn du mit Batch Dateien vertraut bist, kannst du den ganzen Aufruf ein paar hundert Mal in die Batch Datei schreiben lassen (es gibt utilities, die ein Verzeichnis (mit den pdf) auslesen und in ein Textfile portieren!) und dann das Batchfile abarbeiten lassen.

Käme auf einen Versuch an - geht schnell und das Ergebnis vom Mobilreader ist, wie gesagt, schon mal nicht schlecht. Sicher ist dann noch Nacharbeit angesagt.

Klaus

Last edited by kbaerwald; 05-19-2012 at 02:59 PM.
kbaerwald is offline   Reply With Quote
Old 05-20-2012, 04:29 AM   #14
Doitsu
Grand Sorcerer
Doitsu ought to be getting tired of karma fortunes by now.Doitsu ought to be getting tired of karma fortunes by now.Doitsu ought to be getting tired of karma fortunes by now.Doitsu ought to be getting tired of karma fortunes by now.Doitsu ought to be getting tired of karma fortunes by now.Doitsu ought to be getting tired of karma fortunes by now.Doitsu ought to be getting tired of karma fortunes by now.Doitsu ought to be getting tired of karma fortunes by now.Doitsu ought to be getting tired of karma fortunes by now.Doitsu ought to be getting tired of karma fortunes by now.Doitsu ought to be getting tired of karma fortunes by now.
 
Doitsu's Avatar
 
Posts: 5,583
Karma: 22735033
Join Date: Dec 2010
Device: Kindle PW2
Quote:
Originally Posted by kbaerwald View Post
Der reader.exe lässt sich auf der Kommandozeile mit <reader.exe abcdef.pdf> aufrufen, danach verrichtet er sein Werk (und nicht mal schlecht). Er benutzt dafür pdf2xml.exe. prc in epub zu wandeln ist mit calibre kein Thema.
Ich wusste nicht, dass der Reader auch einen integrierten Konverter hat. Man kann Reader.exe tatsächlich über die Befehlszeile mit dem Namen der PDF-Datei aufrufen, aber dadurch wird letztendlich auch die Reader-Benutzeroberfläche geladen. D.h. die Befehlszeilen-Methode ist nicht für mehrere Dateien geeignet.

Wer Calibre installiert hat, kann die folgende Batch-Datei verwenden, die alle PDF-Dateien in einem Ordner in ePubs konvertiert:

Code:
FOR %%f IN ("*.pdf") DO  (
   ebook-convert "%%~nf.pdf" "%%~nf.ePub"  --enable-heuristics --no-default-epub-cover --pretty-print --dont-split-on-page-breaks	
)
Dazu einfach einfach die Programmzeilen in eine Textdatei kopieren und mit der Erweiterung .cmd oder .bat in demselben Ordner wie die PDF-Dateien speichern. Dann muss man nur doch die Batch-Datei ausführen und Calibre macht den Rest.

Mit Mobipocket Reader konvertierte PDF-Dateien sehen allerdings besser aus, und da Mobipocket Reader Drag & Drop unterstützt, könnte man auch alle PDF-Dateien im Explorer auswählen und dann auf das Mobipocket Reader-Fenster ziehen. Die so erhaltenen PRC-Dateien könnte man dann mit derselben Batchdatei konvertieren, wenn man die folgenden Zeilen von:

Code:
FOR %%f IN ("*.pdf") DO  (
ebook-convert "%%~nf.pdf" "%%~nf.ePub"  --enable-heuristics --no-default-epub-cover --pretty-print --dont-split-on-page-breaks
in

Code:
FOR %%f IN ("*.prc") DO  (
ebook-convert "%%~nf.prc" "%%~nf.ePub"  --enable-heuristics --no-default-epub-cover --pretty-print --dont-split-on-page-breaks
ändert.

Last edited by Doitsu; 05-20-2012 at 04:50 AM.
Doitsu is offline   Reply With Quote
Old 05-20-2012, 04:35 AM   #15
kbaerwald
BioReader
kbaerwald understands when you whisper 'The dog barks at midnight.'kbaerwald understands when you whisper 'The dog barks at midnight.'kbaerwald understands when you whisper 'The dog barks at midnight.'kbaerwald understands when you whisper 'The dog barks at midnight.'kbaerwald understands when you whisper 'The dog barks at midnight.'kbaerwald understands when you whisper 'The dog barks at midnight.'kbaerwald understands when you whisper 'The dog barks at midnight.'kbaerwald understands when you whisper 'The dog barks at midnight.'kbaerwald understands when you whisper 'The dog barks at midnight.'kbaerwald understands when you whisper 'The dog barks at midnight.'kbaerwald understands when you whisper 'The dog barks at midnight.'
 
kbaerwald's Avatar
 
Posts: 292
Karma: 42568
Join Date: Apr 2009
Location: Germany
Device: Various
Hallo doitsu

schöne Lösung
kbaerwald is offline   Reply With Quote
Reply


Forum Jump

Similar Threads
Thread Thread Starter Forum Replies Last Post
benutzerdefinierte Meta Tags bei PDF Dateien Thommynat0r Software 1 03-04-2012 05:40 AM
Qualität von Amazons PDF-Konverter Alaska Amazon Kindle 3 07-14-2011 08:03 AM
PDF Dateien zerschnibbeln und wieder zusammenfügen - für Sony PRS 600 optimieren Shyne Software 6 04-23-2010 04:15 AM
PDF-Dateien auf dem PocketBook Ulli PocketBook 10 02-27-2010 03:34 PM
PDF Anzeige von eBook Readern Josch91 Erste Hilfe 8 04-18-2009 04:02 PM


All times are GMT -4. The time now is 04:47 AM.


MobileRead.com is a privately owned, operated and funded community.