View Single Post
Old 07-23-2009, 08:26 AM   #4
netseeker
sleepless reader
netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.
 
netseeker's Avatar
 
Posts: 4,770
Karma: 615335
Join Date: Jan 2008
Location: Germany, near Stuttgart
Device: Sony PRS-505, PB 360° & 302, nook wi-fi, Kindle 3
Quote:
Originally Posted by Targor View Post
Muss der Publisher der von zeno angegebene sein oder ist das nur für die erstellte Datei wichtig?
Publisher, Autor, Titel und ggfs. Untertitel sind nur für die erstellte Datei wichtig.

Quote:
Originally Posted by Targor View Post
Hab beim ersetn Durchlauf einen Fehler, erstes Kapitel funktionierte mit Unterkapitel, beim zweiten Teil kam der Fehler. Die Dateien liegen im .tmp Format vor und können mit FF geöffnet werden, sehen genauso aus, wie eine "Seite speichern unter" HTML Datei. Unten die Fehlermeldung.

Zweiter Durchlauf ist bereits beim ersten Unterkapitel zweiter Teil.
Kannst Du, wenn der Fehler auftritt, den benutzten Link via Browser noch erreichen? Das sieht so aus, als ob entweder deine Internetverbindung "wackelt" oder Zeno ab und zu mal weg ist bzw. keine Verbindung mehr annimmt. Ich teste heute Abend mal ebenfalls mit Anna Karenina um sicher zu gehen, dass es nicht doch irgendwas mit diesem speziellen Buch zu tun hat.

Die "tmp-Dateien" sind lediglich Abfallprodukte vom Spider beim Ermitteln der Links für die einzelnen Abschnitte. Die werden nichtmal ausgewertet. Ich parse jeden Abschnitt in die Datei index.html, welche dann nach dem parsen wieder gelöscht wird - es sei denn es tritt ein Fehler auf.
netseeker is offline   Reply With Quote