Bonjour
J'ai demandé à changer le titre de ce fil pour le rendre plus explicite.
édition
Deux œuvres d'Alexandre Dumas fils:
- un recueil de nouvelles,
"La boite d'argent"
- une histoire d'amour,
"Le roman d'une femme"
Les sources d'images PDF de livres anciens
Les deux principales sont, à ma connaissance, Gallica et Google books. La qualité technique de leurs images diffère sensiblement.
Les images de Gallica sont en moyenne d'une résolution de 300 ppi. Leur qualité varie beaucoup, non seulement selon l'état du livre (important) mais aussi, semble-t-il, selon l'humeur de l'opérateur. Leur qualité semble aller en s'améliorant.
La résolution des images de Google est variable mais en général plus élevée (de 600 à 1000 ppi). Leur qualité est aussi plus constante. La reconnaissance des textes nécessite alors des machines plus puissantes mais le résultat obtenu est bien meilleur.
Tout se passe comme si ces deux types d'image étaient conçues pour des générations informatiques différentes, Gallica desservant la plus ancienne.
Google fournit aussi soit des textes bruts (par groupes de quelques pages le plus souvent) ou des EPUB. L'un comme l'autre semblent n'avoir fait l'objet d'aucun traitement manuel et sont donc très perfectibles. En pratique, on n'éprouve guère de plaisir à lire ce genre de textes.
Bien que l'on puisse trouver, ici et là, des images PDF d'excellente qualité chez Gallica, si vous avez le choix, il me semble qu'il vaut mieux utiliser comme source de votre futur EPUB le texte brut ou l'EPUB de Google.
Logiciels
Les deux logiciels avec lesquels j'ai l'habitude de travailler sont
LibreOffice (ou OpenOffice) et son extension
writer2xhtml. L'auteur de l'extension, Henrik Just, n'a pas été très actif ces derniers mois.
Par contre, la suite LibreOffice avec sa version 3.5 sortie le jour de la Saint-Valentin (aucun rapport) a enregistré de nets progrès. Elle est aussi devenue plus réactive.