View Single Post
Old 04-30-2009, 10:07 AM   #3
rc006
Junior Member
rc006 began at the beginning.
 
Posts: 3
Karma: 10
Join Date: Apr 2009
Device: prs-505
Je vois qu'il n'y a pas beaucoup de recettes francaises, alors en voilà une de plus:
Code:
#!/usr/bin/env  python

__license__   = 'GPL v3'
__copyright__ = '2008, Kovid Goyal <kovid at kovidgoyal.net>'
'''
figaro.fr
'''

from calibre.web.feeds.news import BasicNewsRecipe

class LeFigaro(BasicNewsRecipe):
    title          = u'Le Figaro'
    __author__     = 'rc006'
    description    = 'News from France Le Figaro'
    no_stylesheets = True
    language = _('French')
    oldest_article = 7
    max_articles_per_feed = 100
#    cover_url = 'http://www.lefigaro.fr/icones/print_cartouche.gif'


    keep_only_tags = [
   						dict(name='div', attrs={'class':'infos'}),
   						dict(name='h1'),
   						dict(name='h2'),
   						dict(name='h3'),
    					dict(name='div', attrs={'class':'texte'}),
    				 ]
    				  

    feeds          = [
                      (u'Actualités', u'http://www.lefigaro.fr/rss/figaro_actualites.xml'),
                      (u'Flash Actu', u'http://www.lefigaro.fr/rss/figaro_flash-actu.xml'),
                      (u'International', u'http://www.lefigaro.fr/rss/figaro_international.xml'),
                      (u'Santé', u'http://www.lefigaro.fr/rss/figaro_sante.xml'),
                      (u'Débats & Opinions', u'http://www.lefigaro.fr/rss/figaro_debats.xml'),
                      (u'Sciences', u'http://www.lefigaro.fr/rss/figaro_sciences.xml'),
                      (u'Economie', u'http://www.lefigaro.fr/rss/figaro_economie.xml'),
                      (u'Marchés', u'http://www.lefigaro.fr/rss/figaro_marches.xml'),
                      (u'Patrimoine', u'http://www.lefigaro.fr/rss/figaro_patrimoine.xml'),
                      (u'Immobilier', u'http://www.lefigaro.fr/rss/figaro_immobilier.xml'),
                      #(u'blablabla ...', u'http://www.lefigaro.fr/rss/XXXX.xml'),
                     ]


    def get_article_url(self, article):
		texte = unicode(article)
		#used because actu &flash rss use html redirection for the main link
		if texte.find('link=')!=-1:
			texte = texte[(texte.find('link=')+5):]
			url = (texte[0:(texte.find('.php')+4)])
		else:
			url = article.get('link', None)
			
		return url.encode('utf8')
		
    def print_version(self, url):
        return url+u'?mode=imprimer'
Le seul souci, c'est les news de l'actu et flash actu qui viennent de l'AFP et qui sont dans des balises h2, ca fait un saut de page et la police est énorme.
Sinon, c'est parfait, si vous pouvez tester

Je compte aussi faire une recette pour les Echos, à moins que quelqu'un l'ai déjà faite?
(il utilise une fonction imprimer.php à partir des page html, donc c'est un peu plus compliqué)

Last edited by rc006; 04-30-2009 at 10:09 AM.
rc006 is offline   Reply With Quote