View Single Post
Old 05-19-2016, 11:19 AM   #4
Arios
A curiosus lector!
Arios ought to be getting tired of karma fortunes by now.Arios ought to be getting tired of karma fortunes by now.Arios ought to be getting tired of karma fortunes by now.Arios ought to be getting tired of karma fortunes by now.Arios ought to be getting tired of karma fortunes by now.Arios ought to be getting tired of karma fortunes by now.Arios ought to be getting tired of karma fortunes by now.Arios ought to be getting tired of karma fortunes by now.Arios ought to be getting tired of karma fortunes by now.Arios ought to be getting tired of karma fortunes by now.Arios ought to be getting tired of karma fortunes by now.
 
Arios's Avatar
 
Posts: 463
Karma: 2015140
Join Date: Jun 2012
Device: Sony PRS-T1, Kobo Touch
Salut JPS,

Je ne suis pas modo ici, mais je pense:

1) que tes images sont trop grandes et

2) qu'il faut éviter de diffuser ici, si c'est le cas, des textes qui ne sont pas dans le domaine public.

En ce qui concerne ton problème, voici ce que je ferais.
  1. J'utiliserais Calibre pour convertir le pdf au format docx et
  2. ensuite j'utiliserai, avec Libre Office, l'extension "MyTTXTcleaner" de eBookLuke pour éliminer les fins de lignes inappropriées. (Tu devrais trouver l'extension ici: http://lukesblog.it)
  3. Le texte ainsi nettoyé pourrait alors être sauvegardé au format epub.
Cela semble un peu tortueux, mais ça devrait fonctionner. Sinon tu peux utiliser avec Ebook-edit de Calibre la fonction regex pour restructurer le texte et enlever les fins de paragraphes non pertinentes. Pour cela, cependant, je ne peux t'aider, mais Doitsu le pourrait sans doute.

Finalement un autre possibilité pourrait être d'utiliser un logiciel ORC comme ABBYY FineReader qui est plutôt efficace dans ce genre de situation, mais son prix d'achat est élevé.
Arios is offline   Reply With Quote