Thread: Gutenberg_DE
View Single Post
Old 06-13-2008, 12:27 PM   #1
Nergal
eBuchReisender
Nergal doesn't litterNergal doesn't litterNergal doesn't litter
 
Nergal's Avatar
 
Posts: 41
Karma: 208
Join Date: May 2008
Location: Münster
Device: Palm Tungsten-E, iLiad
Cool Gutenberg_DE

Update: 20. Juni 2008 - Wer es schon heruntergeladen hat: am besten nochmal. Version 5b ist fertig - Features in den folgenden Posts

Ich weiß nicht wie es Euch auf den Gutenberg-DE-Seiten so ergeht, mich hat das zerschnippselte HTML schon immer gestört. Und derzeit ohne iLiad zum Lesen und Spielen und Arbeiten (es gibt sie doch die drei Wünsche auf einmal!) habe ich mich mal darangesetzt einen kleinen Grabber zu basteln.

gbde.py nimmt auf der Befehlszeile eine in Anführungszeichen eingebundene volle url auf.

Code:
python gbde.py "http://gutenberg.spiegel.de/index.php?id=5&xid=4227&kapitel=1&cHash=6764077ba5#gb_found"
Dann dauert es ein kleines bisl, je nachdem wie groß das Buch ist und schwupp hat man eine fertige HTML-Datei. Diese ist so vorbereitet, daß man sie mit mobipocket (mobigen.exe) umwandeln kann.

Ohne mobipocket-reader ist es für mich gerade nicht möglich zu testen, wie die umlaute und so rüber kommen. Wie immer ist Rückmeldung willkommen für Fehler, Ideen, usw. usf.

=== ACHTUNG ===
Dieses Skript darf man nur zu privaten Zwecken einsetzen. Das Copyright auf Gutenberg-DE ist ein bisl verschroben: die Texte an sich wären frei verfügbar, aber da ja ein bisl am Layout gearbeitet wurde von Hille & Partner ist das, was auf den Servern dort liegt doch wieder nicht ganz so frei. Man darf keine Archive davon veröffentlichen oder sonstwie über den privaten Gebrauch hinaus was damit anstellen. Deshalb habe ich den Copyright-Vermerk in jedes Buch mit eingebaut. *Seufz*

Ich habe aber nicht finden können, daß es nicht erlaubt sein soll einen *ähem* speziellen Browser zu verwenden, der die Seiten ein bisl von Ballast befreit und neu kompiliert .
=====ENDE ACHTUNG =====

Also wenn Ihr was von Gutenberg-DE lesen wollt - büddeschön. Muß halt jeder für sich selber herunterladen und in mobipocket oder mit htmldoc in PDF umwandeln.

Viel Spaß
Nergal

P.S.: Die Url im Beispiel ist die Autobiographie von Schliemann

17+7+13+7
Attached Files
File Type: zip gbde.py.zip (6.0 KB, 2175 views)

Last edited by Nergal; 06-20-2008 at 03:47 PM. Reason: Version 5b
Nergal is offline   Reply With Quote