View Full Version : Omnipage17 konvertiert Inhalte für e-Books


Marc_liest
11-12-2009, 12:50 PM
Auf dem ebookblog (http://www.ebookblog.de/2009/11/omnipage17-konvertiert-inhalte-fuer-ebooks/) zu lesen:

Mit optischer Zeichenerkennung (OCR) konvertiert OmniPage 17 gescannte Papierdokumente und Bilddateien in bearbeitbaren Text, den man dann in anderen Programmen weiterverarbeiten oder in einem beliebigen Format archivieren kann. Die neue OmniPage-Version 17 unterstützt verschiedene E- Books, unter anderen das kürzlich in den USA auf den Markt gebrachte Kindle 2.0, und ermöglicht eine automatische Neuformatierung für ein einfaches Lesen und Navigieren.
OmniPage erstellt das Dokument für die E-Books mit den erforderlichen Such- und Vorlese-Funktionen (Text-to-Speech, TTS).

Es wird immer einfacher sein Lieblingsbuch (auch ohne die Hilfe der schlummernden Verlage) auf den Reader zu bringen.

presto
11-14-2009, 10:06 AM
Als ebook-Format ist in Omnipage die Endung .opf angegeben.

Ist das das Kindle-Format?

Marc_liest
11-14-2009, 11:33 AM
Nein

Open Packaging Format (OPF) 2.0 für die Beschreibung der Struktur der .epub-Dateien in XML

mtravellerh
11-14-2009, 11:47 AM
Nein

Open Packaging Format (OPF) 2.0 für die Beschreibung der Struktur der .epub-Dateien in XML

Ja schon, aber nicht nur. Auch Mobis und Lits werden auf der Basis von OPF-Dateien erstellt.

Marc_liest
11-14-2009, 01:41 PM
Einigen wir uns also auf ein Jein ;-)

PantaRhei
04-19-2010, 06:46 AM
Hat jemand das schon ausprobiert? Und welcher Scanner waere dafuer geeignet ueber den Plustek liest man gutes (ausgenommen der software).

Wie werden eigentlich bilder in epubs verwendet?

Montyp535
04-20-2010, 04:53 PM
also auf direktem Weg würd ich das nicht machen, dafür ist die Erkennung nicht soo doll - das kann abbyy etwas besser.
Auch kann man über den "kleinen Umweg" rtf/doc noch die Formatierungen hübsch machen - aber das scannen ist bei so was eh das wenigste...

gulu-gulu
04-21-2010, 04:45 AM
Ich habe zwar keinen Scanner, aber dafür habe ich mal ein wenig mit abbyy gespielt und versucht pdfs in ein epub zu verwandeln. Klappt prinzipiell erste Sahne, die Zeichenerkennung ist Tip-Top! Allerdings ist gerade das Nacharbeiten meiner Meinung nach zeitlich doch recht aufwendig. Verglichen dazu habe ich einfach das gleiche pdf mit Calibre one-click-umwandeln lassen. Vom Ergebnis her einen Tick schlechter, aber Zeit/Leistungs-technisch unschlagbar..
Das nur mal so nebenbei :)

Manichean
04-21-2010, 06:14 AM
Ich habe zwar keinen Scanner, aber dafür habe ich mal ein wenig mit abbyy gespielt und versucht pdfs in ein epub zu verwandeln. Klappt prinzipiell erste Sahne, die Zeichenerkennung ist Tip-Top! Allerdings ist gerade das Nacharbeiten meiner Meinung nach zeitlich doch recht aufwendig. Verglichen dazu habe ich einfach das gleiche pdf mit Calibre one-click-umwandeln lassen. Vom Ergebnis her einen Tick schlechter, aber Zeit/Leistungs-technisch unschlagbar..
Das nur mal so nebenbei :)
Uhm, Calibre macht aber keine OCR, oder? Und was genau meinst Du mit one-click?

gulu-gulu
04-21-2010, 10:11 AM
Ich hab keine Ahnung wie Calibre das macht.. aber es gibt die Option ein pdf-File einzulesen und als epub zu exportieren.. das meine ich mit One-Click.

Montyp535
04-21-2010, 02:41 PM
der text ist im pdf ja auch als text drin, soweit er nicht innerhalb einer grafik als bild erscheint. Bei Adobe (ohne das "reader") gibt es ja auch die funktion, den text als solchen zu exportieren oder im reader über "alles markieren - kopieren" die sache in zB word einzufügen. Nichts anderes wird calibre machen.
Dumm ist nur, wenn die textblöcke zwar korrekt angezeigt werden, aber das pdf defekt ist - dann fehlt entweder text oder steht in falscher reihenfolge.

Beim auslesen über ocr wird halt jede seite als bild betrachtet und relativ sauber ausgelesen, da die schrift ja sehr sauber ist. solche blockfehler können da nicht auftreten.

Manichean
04-21-2010, 05:54 PM
Ah. Ich ging von einer PDF aus, in der der Text als Scan der Seite vorliegt (als eingebettetes Bild). Wozu braucht man sonst bei einer PDF ein OCR-Programm, um ein ePub draus zu machen?

gulu-gulu
04-22-2010, 03:21 AM
Braucht man in der Tat bei Text-Pdfs eigentlich nicht :)

Montyp535
04-30-2010, 03:51 AM
...außer, die pdf ist besch...eiden oder man will den text noch nachformatieren :-) ... oder die nicht als text-hinterlegtes bild vorliegen (hatte ich auch schon...)