Quote:
Originally Posted by iceman01
Ich habe ja auch nicht bezweifelt, dass der Inhalt ok ist, nur durch OCR Erkennung und evtl. Überlagerung von Text- und Bildbereichen können solche Fehler in der Struktur entstehen. Eben die Probleme die du beschrieben hast. Ich wollte nur helfen zu klären, wie so etwas entstehen kann. Denn es ist ja durchaus möglich, dass jemand mal probiert ein Dokument per OCR in PDF zu verwandeln.
|
Die Fehler in der Struktur enstehen durch Fehler im erzeugenden Programm bzw. der verwendeten Bibliothek.,nicht durch den Inhalt. Das hat mit OCR erst mal rein gar nichts zu tun. PDF ist kein triviales Format und durch bloßen Augenschein kann man keine fundierten Aussagen treffen. Man muß das Dokument analysieren. Entschuldigung, aber das ist die unfreundliche Wahrheit.
Und bitte nicht Dokumentstruktur (PDF) und Layout (Seite) durcheinanderbringen.