View Single Post
Old 12-29-2011, 03:33 AM   #125
roger64
Wizard
roger64 ought to be getting tired of karma fortunes by now.roger64 ought to be getting tired of karma fortunes by now.roger64 ought to be getting tired of karma fortunes by now.roger64 ought to be getting tired of karma fortunes by now.roger64 ought to be getting tired of karma fortunes by now.roger64 ought to be getting tired of karma fortunes by now.roger64 ought to be getting tired of karma fortunes by now.roger64 ought to be getting tired of karma fortunes by now.roger64 ought to be getting tired of karma fortunes by now.roger64 ought to be getting tired of karma fortunes by now.roger64 ought to be getting tired of karma fortunes by now.
 
Posts: 2,608
Karma: 3000161
Join Date: Jan 2009
Device: Kindle PW3 (wifi)
Bonjour

édition

Les confessions de Marion Delorme. Il s'agit d'un gros EPUB dont l'odt est joint ici.

L'EPUB comprend quelques illustrations et une police incorporée. Il a été réalisé dans les conditions habituelles.

Résolution des PDF images.

Les PDF image que l'on peut télécharger chez Gallica ont une résolution moyenne de 300 ppp qui se prête parfaitement aux travaux d'OCR.

J'ai remarqué que chez Google books, on trouve désormais de PDF images très agréables à lire d'une résolution bien supérieure (800 ppp environ). L'inconvénient, est qu'ils me semblent convenir moins bien aux travaux d'OCR. Sur mon -vieil- ordinateur, le délai de reconnaissance est multiplié par vingt... Parfois, dans sa miséricorde, Google joint un EPUB, brut d'OCR, qui peut servir de base de travail. Mais, ce n'est pas encore un cas général.

Si quelqu'un a des tuyaux à ce sujet...
Attached Files
File Type: zip Confessions.odt.zip (1.62 MB, 824 views)

Last edited by roger64; 07-02-2012 at 03:46 AM.
roger64 is offline   Reply With Quote