Ciao tutti
aprofitto delle conoscenze degli esperti e chiedo un aiuto
Non riesco a costruire la ricetta personalizzata per scaricare gli articoli da
www.luogocomune.net
Questi i dati:
RSS feed:
http://www.luogocomune.net/site/backend.php
print version (an example):
http://www.luogocomune.net/site/modu...p?storyid=2223
al posto di
http://www.luogocomune.net/site/modu...p?storyid=2223
la mia ricetta
class LuogoComune(BasicNewsRecipe):
title = u'LuogoComune'
oldest_article = 180
max_articles_per_feed = 100
remove_attributes = ['style', 'font', 'width', 'height']
language = 'it'
feeds = [(u'LuogoComune', u'http://www.luogocomune.net/site/backend.php/')]
def print_version(self, url):
return url.replace('article.php', 'print.php')
i principali problemi:
1) i tentativi odierni hanno prodotto un file epub di 49 pagine: il primo articolo inizia a pagina 7 ma solo con un link; l'articolo "vero" v da pag. 8 a pag. 16 ma è come una UNICA PAGINA e io posso leggere solo la prima pagina, cioè la 8. Il mio sony prs650 non può scrollare verso il basso (mentre il browser internoa calibre può e non fa capire il problema...) e quando a pag. 8 premo "pagina avanti" finisco direttamente a pg. 17! - da notare che la mia ricetta, dopo aver aggiunto "remove_attributes = ['style', 'font', 'width', 'height']", funziona in senso orizzontale ma non ancora in verticale
2) alcuni caratteri italiano non vengono riconosciuti (es. apostrofo ') e vengono sostituiti da ?
Grazie per l'aiuto!