Thread: Gutenberg_DE
View Single Post
Old 08-04-2011, 02:41 AM   #76
Lebewesen
Junior Member
Lebewesen has a complete set of Star Wars action figures.Lebewesen has a complete set of Star Wars action figures.Lebewesen has a complete set of Star Wars action figures.Lebewesen has a complete set of Star Wars action figures.Lebewesen has a complete set of Star Wars action figures.
 
Lebewesen's Avatar
 
Posts: 6
Karma: 444
Join Date: May 2011
Device: OYO
Einfaches Kopieren von Gutenberg-DE

Ich habe ein AutoPager Skript erstellt, das alle Seiten hintereinander auf den Bildschirm lädt. Damit ist es dann kein Problem alles auf einmal zu kopieren.

Für Gutenberg-DE
Code:
<autopager>
<site><urlPattern>http://gutenberg.spiegel.de/buch/*</urlPattern>
<guid>03E77C9C-6BE2-F813-9EE8-F01B-3E0B-82B5</guid>
<margin>3</margin>
<owner>Bastian Hepp</owner>
<enableJS>false</enableJS>
<quickLoad>true</quickLoad>
<contentXPath>//div[@id='gutenb']</contentXPath>
<testLink>http://gutenberg.spiegel.de/buch/1834/2</testLink>
<linkXPath>//div[@id='spArticleColumn']/a[contains(text(),'&gt;&gt;')]</linkXPath>
<desc>AutoPager rule for gutenberg.spiegel.de</desc>
</site>
</autopager>
Und auch noch für Zeno.org

Code:
<autopager>
<site><urlPattern>http://www.zeno.org/Literatur/*</urlPattern>
<guid>21D6CA09-0BA2-13F6-18D7-E27E-FAB3-99F2</guid>
<margin>1</margin>
<owner>Bastian Hepp</owner>
<enableJS>false</enableJS>
<quickLoad>true</quickLoad>
<contentXPath>//div[@id='zenoCOText' and @class='zenoCO']/div[@class='zenoCOMain']</contentXPath>
<testLink>http://www.zeno.org/Literatur/M/Arnim,+Ludwig+Achim+von/Erz%C3%A4hlungen/Der+Wintergarten</testLink>
<linkXPath>//a[@rel='next']</linkXPath>
<desc>AutoPager rule for www.zeno.org</desc>
</site>
<site><urlPattern>http://www.zeno.org/Literatur/*</urlPattern>
<guid>BC5A4276-071E-EE2E-4FD6-4F18-C9D7-CFAB</guid>
<margin>1</margin>
<owner>Bastian Hepp</owner>
<enableJS>false</enableJS>
<quickLoad>true</quickLoad>
<contentXPath>//body</contentXPath>
<testLink>http://www.zeno.org/Literatur/M/Arnim,+Ludwig+Achim+von/Erz%C3%A4hlungen/Der+Wintergarten</testLink>
<linkXPath>//div[@id='zenoCOText']/div[3]</linkXPath>
<desc>AutoPager rule for www.zeno.org</desc>
</site>
</autopager>
Man muss einfach nur die AutoPager Grenzen entfernen, und hat dann das ganze Buch.

Die Regeln finden sich nun auch Online für Autopager.

Last edited by Lebewesen; 08-04-2011 at 02:54 AM.
Lebewesen is offline   Reply With Quote