Pour ma part, tout ce que je lis, que ce soit en français ou en anglais, livre ou RSS, tout provient de mon projet:
http://www.feedbooks.com
En français on doit trouver entre 1.500 et 2.000 textes numérisés correctement sur le net pour ce qui est libre de droit, donc ça laisse quand même du choix (et de la marge côté ajouts possibles sur Feedbooks).
Il y a surement beaucoup de textes que cela dispo mais il faudrait faire l'OCR et la relecture/mise en forme. A terme on peut s'attendre à des dizaines de milliers de textes je pense.