Je viens de regarder à l'instant chez Gallica la version texte de "Les Dieux ont soif" . Elle me parait d'excellente qualité alors qu'ils affichent toujours un taux de reconnaissance "officiel" de 98%. Le taux réel me parait nettement supérieur à première vue et, en tout cas, immédiatement lisible.
Une comparaison avec le premier texte frais émoulu de l'OCR que tu as "nettoyé" pour ton édition FeedBooks serait sans doute intéressante. N'y a t-il pas eu une mise à jour discrète? Qu'en penses-tu?
Bizarre...
PS: tu devrais supprimer les noms propres. On parle de Gallica.