View Single Post
Old 02-17-2012, 06:30 AM   #127
roger64
Wizard
roger64 ought to be getting tired of karma fortunes by now.roger64 ought to be getting tired of karma fortunes by now.roger64 ought to be getting tired of karma fortunes by now.roger64 ought to be getting tired of karma fortunes by now.roger64 ought to be getting tired of karma fortunes by now.roger64 ought to be getting tired of karma fortunes by now.roger64 ought to be getting tired of karma fortunes by now.roger64 ought to be getting tired of karma fortunes by now.roger64 ought to be getting tired of karma fortunes by now.roger64 ought to be getting tired of karma fortunes by now.roger64 ought to be getting tired of karma fortunes by now.
 
Posts: 2,608
Karma: 3000161
Join Date: Jan 2009
Device: Kindle PW3 (wifi)
Bonjour

J'ai demandé à changer le titre de ce fil pour le rendre plus explicite.

édition

Deux œuvres d'Alexandre Dumas fils:

- un recueil de nouvelles, "La boite d'argent"

- une histoire d'amour, "Le roman d'une femme"

Les sources d'images PDF de livres anciens

Les deux principales sont, à ma connaissance, Gallica et Google books. La qualité technique de leurs images diffère sensiblement.

Les images de Gallica sont en moyenne d'une résolution de 300 ppi. Leur qualité varie beaucoup, non seulement selon l'état du livre (important) mais aussi, semble-t-il, selon l'humeur de l'opérateur. Leur qualité semble aller en s'améliorant.

La résolution des images de Google est variable mais en général plus élevée (de 600 à 1000 ppi). Leur qualité est aussi plus constante. La reconnaissance des textes nécessite alors des machines plus puissantes mais le résultat obtenu est bien meilleur.

Tout se passe comme si ces deux types d'image étaient conçues pour des générations informatiques différentes, Gallica desservant la plus ancienne.

Google fournit aussi soit des textes bruts (par groupes de quelques pages le plus souvent) ou des EPUB. L'un comme l'autre semblent n'avoir fait l'objet d'aucun traitement manuel et sont donc très perfectibles. En pratique, on n'éprouve guère de plaisir à lire ce genre de textes.

Bien que l'on puisse trouver, ici et là, des images PDF d'excellente qualité chez Gallica, si vous avez le choix, il me semble qu'il vaut mieux utiliser comme source de votre futur EPUB le texte brut ou l'EPUB de Google.

Logiciels

Les deux logiciels avec lesquels j'ai l'habitude de travailler sont LibreOffice (ou OpenOffice) et son extension writer2xhtml. L'auteur de l'extension, Henrik Just, n'a pas été très actif ces derniers mois.

Par contre, la suite LibreOffice avec sa version 3.5 sortie le jour de la Saint-Valentin (aucun rapport) a enregistré de nets progrès. Elle est aussi devenue plus réactive.

Last edited by roger64; 02-17-2012 at 06:50 AM.
roger64 is offline   Reply With Quote