View Single Post
Old 01-17-2014, 05:20 PM   #161
fortwienix
Enthusiast
fortwienix is clearly one to watchfortwienix is clearly one to watchfortwienix is clearly one to watchfortwienix is clearly one to watchfortwienix is clearly one to watchfortwienix is clearly one to watchfortwienix is clearly one to watchfortwienix is clearly one to watchfortwienix is clearly one to watchfortwienix is clearly one to watchfortwienix is clearly one to watch
 
Posts: 47
Karma: 10848
Join Date: Mar 2011
Device: 902
Hi,

bei der Süddeutschen hat sich in der Tat ein bischen was am Layout geändert. Die sollte mit nachfolgendem Script wieder funktionieren. Ich habs aber nur auf dem Rechner, nicht am Pocketbook getestet.
Bei der TAZ sehe ich auf die Schnelle keine Lösung. Auf dem Rechner tut mein altes Script jedenfalls noch. Das Inhaltsverzeichnis wird normalerweise aus den <h1> Überschriften generiert, die auf der Seite vorkommen. Das sollte meines Erachtens eigentlich funktionieren. Wegen der Kästen etc. bräuchte ich mal ein Beispiel (möglichst ne URL).
In einen der Posts weiter vorn hab ich versucht ein bischen zu erklären, wie die Scripte funktionieren. Man läd das HTML herunter und macht wilde Textersetzungen mit sed, grep und der Ausgabeumleitung in eine Datei. Ein allgemeines Rezept gibt es nicht. Calibre auf dem Rechner kann natürlich die Struktur des HTML Elements parsen. Da wird es dann einfacher, wenn man z.B. Textboxen, die an einer anderen Stelle im Dokument vorkommen, zu extrahieren und an die richtige Stelle im Zieldokument zu setzen. Das geht mangels Software auf dem Pocketbook nicht.
Das angehangene Script ist nichts weiter als ein Shellscript. Du kannst es unter Windows mit einem Editor (N++ oder so, nicht der Standard Windowskram) öffnen und verändern. Zum Testen reicht unter Windows eine Cygwin Umgebung.

Grüße, fortwienix
Attached Files
File Type: zip sueddeutsche.zip (1.3 KB, 273 views)
fortwienix is offline   Reply With Quote