Quote:
Originally Posted by McDoof
Sonst bekommt man nur Schlagzeilen, oder?
|
Jepp, du erhältst eben genau nur das, was unter der RSS-Seite angezeigt wird. Jeder weitere klick ist eine Ebene tiefer.
Für den Guardian ist der erste Anfang etwa so:
Code:
'''
Fetch Guardian Unlimited.
'''
from libprs500.ebooks.lrf.web.profiles import DefaultProfile
import re
class GuardianUnlimited(DefaultProfile):
title = 'Guardian Unlimited'
timefmt = ' [ %Y-%m-%d %a]'
max_recursions = 2
max_articles_per_feed = 40
def get_feeds(self):
return [ ('Guardian Unlimited', 'http://www.guardian.co.uk/rss') ]
Danach fängt es mit den Schwierigkeiten erst an.
Du musst irgendwie zu einer Printversion der Artikel kommen (weil die meist als Druckausgabe einfacher gestaltet sind), und dann muss das ganze auch noch einigermaßen auf dem Reader aussehen.