@ygg
J'ai tenté d'OCRiser avec FineReader 9 la version pdf de Gallica de ce livre. Au bout d'une heure j'ai renoncé : il y a vraiment trop de fautes, parfois des membres de phrase voire des phrases manquent...Je n'ai pas regardé la source "image". La source "texte" est inexploitable à ...98%.
Je me suis rabattu, en attendant le résultat de ton excellent travail- sur l'édition anglaise, revue et corrigée de Gutenberg en html. Impeccable.
Ce faisant, j'ai un peu le sentiment de vivre dans un pays sous-développé. Notre majestueuse et ronflonnante Académie, notre "exception culturelle" brandie à tout bout de champ, nos prétentions linguistiques universelles, notre Ministère de la Culture...et au bout du compte, quand on regarde dans les coins, ce n'est pas balayé tous les jours (sauf pour Hadopi)...
J'avais déjà connu le même problème pour les Mémoires de Saint-Simon. Il n'y a qu'une édition -à ma connaissance- gratuite, celle de la société Medusis sous forme de pdf par chapîtres. Il faut donc reconstituer l'ensemble puis "réduire" au format 9x12. Quelques heures de travail mais au moins la qualité de la source est excellente et on n'est pas frustré par le résultat.
Le prix d'un volume moyen de la Pléiade étant de 53 euros, il faudrait payer le prix d'au moins deux readers pour ces Mémoires. Tout pour la culture populaire.