Quote:
Originally Posted by roger64
@ygg
J'ai tenté d'OCRiser avec FineReader 9 la version pdf de Gallica de ce livre. Au bout d'une heure j'ai renoncé : il y a vraiment trop de fautes, parfois des membres de phrase voire des phrases manquent...Je n'ai pas regardé la source "image". La source "texte" est inexploitable à ...98%. 
|
Oui le texte était assez pourri... je me suis tapé courageusement de le remettre d'aplomb à partir du .txt... explication du problème : la collection Pourpre (très joli précurseur du Livre de Poche) se signalait par l'adoption d'une typo extrêmement soignée... avec ligatures! Donc "section" devient systématiquement "sedion" et "affres" devient "aUres"... Plus une très mauvaise reconnaissance des Italiques (nombreuses dans le texte).
Bon : j'ai maintenant bien en tête un superbe bouquin sur la logique de la Terreur et les raisons de Thermidor. Ca n'a pas de prix

ET j'ai des bons réflexes pour le prochain bouquin à retaper...
Quote:
Je me suis rabattu, en attendant le résultat de ton excellent travail-
|
En cours d'examen en ce moment même sur FeedBook (merci Zelda!)
Quote:
sur l'édition anglaise, revue et corrigée de Gutenberg en html. Impeccable.
|
Bon ça veut juste dire que quelqu'un s'est tapé le même travail, en anglais...
Par parenthèse, sais-tu comment rendre à Gallica "mon" texte --honnêtement infiniment supérieur au leur? Autant que mon labeur serve...
Bon c'est pas tout ça, as-tu lu le Milan Kundera où il dit --paraît-il-- grand bien de "mon" oeuvre ?