View Single Post
Old 05-19-2010, 07:30 AM   #1939
gambarini
Connoisseur
gambarini began at the beginning.
 
Posts: 98
Karma: 22
Join Date: Mar 2010
Device: IRiver Story, Ipod Touch, Android SmartPhone
def get_article_url(self, article):
link = article.get('links')

if link:
return link[0]['href']

Now i am able to find the correct link; but i have another problem:
i don't find the title, so the article show correctly but in the initial page (with all the article) any title.....
Code:
{'summary_detail': {'base': '', 'type': 'text/html', 'value': u'ROMA<br />\xabNo, non \xe8 normale\xbb. Gianfranco Fini, da presidente della Camera, non apprezza che i "suoi" deputati lavorino solo due giorni alla settimana, come \xe8 capitato di recente. E torna a stigmatizzare la pigrizia delle aule parlamentari. Cos\xec non si pu\xf2 andare avanti, \xe8 il messaggio lanciato dal numero uno di Montecitorio. <br /><br />Fini denuncia il \xabparadosso\xbb che si sta creando: tutti stigmatizza ...(continua)', 'language': None}, 'updated_parsed': time.struct_time(tm_year=2010, tm_mon=5, tm_mday=18, tm_hour=11, tm_min=29, tm_sec=24, tm_wday=1, tm_yday=138, tm_isdst=0), 'links': [{'href': u'http://www.lastampa.it/redazione/cmsSezioni/politica/201005articoli/55141girata.asp', 'type': 'text/html', 'rel': 'alternate'}, {'type': 'text/html', 'rel': 'alternate'}], 'author': u'', 'image': {'height': 0, 'width': 0, 'href': u'http://www.lastampa.it/redazione/cmssezioni/politica/201005images/fini05g.jpg', 'link': u'', 'title': u''}, 'tags': [{'term': u'POLITICA', 'scheme': None, 'label': None}], 'updated': u'Tue, 18 May 2010 13:29:24 +0200', 'summary': u'ROMA<br />\xabNo, non \xe8 normale\xbb. Gianfranco Fini, da presidente della Camera, non apprezza che i "suoi" deputati lavorino solo due giorni alla settimana, come \xe8 capitato di recente. E torna a stigmatizzare la pigrizia delle aule parlamentari. Cos\xec non si pu\xf2 andare avanti, \xe8 il messaggio lanciato dal numero uno di Montecitorio. <br /><br />Fini denuncia il \xabparadosso\xbb che si sta creando: tutti stigmatizza ...(continua)', 'title_detail': {'base': '', 'type': 'text/plain', 'value': u'', 'language': None}, 'href': u'http://www.lastampa.it/redazione/cmssezioni/politica/201005images/fini05g.jpg', 'link': u'', 'title': u'', 'id': u'http://www.lastampa.it/redazione/cmssezioni/politica/201005images/fini05g.jpg', 'enclosures': [{'href': u'http://www.lastampa.it/redazione/cmssezioni/politica/201005images/fini05g.jpg', 'type': u'image/jpeg'}]}
Is there a solution? Is there the possibility to extract the title directly from the downloaded article?

The feed appear almost identical to other feeds that work correctly.
http://www.lastampa.it/redazione/cms...s_politica.xml

Last edited by gambarini; 05-19-2010 at 07:59 AM.
gambarini is offline