View Single Post
Old 04-25-2009, 06:03 AM   #32
mtravellerh
book creator
mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.
 
mtravellerh's Avatar
 
Posts: 9,635
Karma: 3856660
Join Date: Oct 2008
Location: Luxembourg
Device: PB360°
Quote:
Originally Posted by YGG- View Post
J'ai pris "Les Dieux ont soif" d'Anatole France, sur Gallica, (Milan Kundera en parle dans son dernier livre) et fait un max de corrections (le résultat de l'OCR était à 97% de réussite... annoncé!).
J'ai maintenant un .pdf "propre" (il doit bien rester des erreurs), avec des têtes de chapitre... et je ne sais pas comment aller plus loin : je voudrais faire une table des matières, et --comme : "Chapitre XIX" c'est pas très clair-- je voudrais que ces titres de chapitres soient de la forme :
"Chapitre IV
Il était dix heures du matin. Le soleil d'avril trempait de lumière les tendres feuilles des arbres..."
Pour donner une idée d'où on est dans le livre...
Comment fais-je ?
Merci d'avance.
Pourquoi un PDF, YGG? Il te faut un format éditable pour convertir aisément. Si tu as un html, tu peux tagger les titres en h2, par exemple et tu utilises Calibre pour créer des chapitres (par l'expression //h2, en ce cas). Les PDFs ne sont pas très flexibles et tu perds ton formatage en convertissant (très embetant (pas de circonflexe sorry)). Donc si tu fais ton OCR, fais une sauvegarde en texte ou en html avant de créer un PDF.
mtravellerh is offline   Reply With Quote