View Single Post
Old 12-01-2010, 01:21 PM   #204
RumpelStielz
Connoisseur
RumpelStielz began at the beginning.
 
Posts: 64
Karma: 12
Join Date: Feb 2010
Device: PRS 650
Quote:
Originally Posted by iceman01 View Post
Ich habe ja auch nicht bezweifelt, dass der Inhalt ok ist, nur durch OCR Erkennung und evtl. Überlagerung von Text- und Bildbereichen können solche Fehler in der Struktur entstehen. Eben die Probleme die du beschrieben hast. Ich wollte nur helfen zu klären, wie so etwas entstehen kann. Denn es ist ja durchaus möglich, dass jemand mal probiert ein Dokument per OCR in PDF zu verwandeln.
Die Fehler in der Struktur enstehen durch Fehler im erzeugenden Programm bzw. der verwendeten Bibliothek.,nicht durch den Inhalt. Das hat mit OCR erst mal rein gar nichts zu tun. PDF ist kein triviales Format und durch bloßen Augenschein kann man keine fundierten Aussagen treffen. Man muß das Dokument analysieren. Entschuldigung, aber das ist die unfreundliche Wahrheit.

Und bitte nicht Dokumentstruktur (PDF) und Layout (Seite) durcheinanderbringen.
RumpelStielz is offline   Reply With Quote