Bonjour
Quote:
Originally Posted by Arios
.../...
2. Le scan de La reine Isabeau est de très mauvaise qualité tu devras donc mettre des dizaines d'heures à la révision du texte et si le français n'est pas ta langue maternelle, ce sera encore plus difficile.../...
|
En ce qui concerne les ouvrages du XIXe, la qualité du scan paraît souvent dégradée à ceux qui sont habitués à scanner plutôt des œuvres contemporaines.
En l'occurrence, je classerais le PDF images de
La reine Isabeau de Gallica parmi leurs scans de qualité standard. J'ai fait un essai d'OCR sur deux pages (pages 100 et 101 du PDF images) en utilisant Fine Reader 11 et vous laisse juger du résultat (voir copie d'écran et zip joint).
Il est vrai qu'il faut en refaire une lecture attentive mais il me semble qu'une telle tâche ne présente rien d'inhabituel ni d'insurmontable... Il est bien possible qu'il y ait par ailleurs quelques pages qui posent problème. Cela se produit, sinon souvent, du moins parfois. Avec un peu de patience, on apprend à faire avec.