View Single Post
Old 05-21-2012, 02:20 AM   #18
kbaerwald
BioReader
kbaerwald understands when you whisper 'The dog barks at midnight.'kbaerwald understands when you whisper 'The dog barks at midnight.'kbaerwald understands when you whisper 'The dog barks at midnight.'kbaerwald understands when you whisper 'The dog barks at midnight.'kbaerwald understands when you whisper 'The dog barks at midnight.'kbaerwald understands when you whisper 'The dog barks at midnight.'kbaerwald understands when you whisper 'The dog barks at midnight.'kbaerwald understands when you whisper 'The dog barks at midnight.'kbaerwald understands when you whisper 'The dog barks at midnight.'kbaerwald understands when you whisper 'The dog barks at midnight.'kbaerwald understands when you whisper 'The dog barks at midnight.'
 
kbaerwald's Avatar
 
Posts: 292
Karma: 42568
Join Date: Apr 2009
Location: Germany
Device: Various
Also - meine Neugier hat mich gestern einmal 800 pdf verschiedener Herkunft(!) mit dem Mobipocket Reader "behandeln" lassen. Es gibt ganz selten Fälle, in denen die Konvertierung nicht geht. Es werden berücksichtigt: reflow, Inhaltsverzeichnisse, Fußnoten, Überschriften etc.. In fast allen Fällen wurden unterschiedlich strukturierte Kopf- und Fußzeilen entfernt. Das geht zwar in calibre auch, aber viel aufwändiger (Regex).

Probleme gibt es bei chaotischen Schrifteneinbettungen, Kapitalen und natürlich Images ohne OCR, manchmal bei Bildern und Tabellen.

Im "Ersteinsatz" und für Routinezwecke im Bereich Belletristik oder einfaches Sachbuch ist der Reader wirklich zu empfehlen, wenn pdf umgewandelt werden soll.

Für den Zweck, den Jacques_N beschreibt, könnte man jedoch auch an calibre denken, da offenbar die Struktur der "Blätter" immer dieselbe ist. Somit kann man einmalig mit einer Regex alle "Problembereiche" erfassen und hat noch den Vorteil, dass sofort die Ziel-ebooks gebildet werden und für calibre Funktionen zugänglich sind.
kbaerwald is offline   Reply With Quote