Register Guidelines E-Books Today's Posts Search

Go Back   MobileRead Forums > E-Book Software > Calibre > Recipes

Notices

Reply
 
Thread Tools Search this Thread
Old 08-27-2011, 05:15 PM   #1
macpablus
Enthusiast
macpablus once ate a cherry pie in a record 7 seconds.macpablus once ate a cherry pie in a record 7 seconds.macpablus once ate a cherry pie in a record 7 seconds.macpablus once ate a cherry pie in a record 7 seconds.macpablus once ate a cherry pie in a record 7 seconds.macpablus once ate a cherry pie in a record 7 seconds.macpablus once ate a cherry pie in a record 7 seconds.macpablus once ate a cherry pie in a record 7 seconds.macpablus once ate a cherry pie in a record 7 seconds.macpablus once ate a cherry pie in a record 7 seconds.macpablus once ate a cherry pie in a record 7 seconds.
 
Posts: 25
Karma: 1896
Join Date: Aug 2011
Device: Kindle 3
Request: Non RSS site recipe (Argentinean newspaper)

Hi everyone.

First of all, thanks very much for the marvellous job with Calibre.

One of the things that attracts me the most is the possibillity to access various source of information trough "Fetch news".

Now, going straight to the point, one of the sites I use to read everyday is the one belonging to argentinean newspaper PAGINA12. But I'm not convinced with the way the default recipe handles it content. For one reason: the first section that appears ("Edición Impresa"), usually contains too many articles, in fact belonging to actua (and different)l sections of the newspaper.

So, I decided to, at least, try to make a recipe of my own, having the one from THE ATLANTIC as a starting point. With no success until now. :-(

The index file for PAGINA12 is this, and for THE ATLANTIC is this

The basic problem, I think, is that I cannot manage to "translate" the HTML tags that point to the different sections. I understand that this lines of codes are the key...

Quote:
for section in soup.findAll('div', attrs={'class':'magazineSection'}):
section_title = self.tag_to_string(section.find('h2'))
Checking the index from THE ATLANTIC, I soon realize that each section is contained in a DIV called magazineSection, and the name of sections holds a H2 tag.

In PAGINA12's index, DIV's section names is seccionx, and (here's the thing), section's names are between an a tag. Here's an example:

Quote:
<div class="seccionx">

<div class="desplegable_titulo on_principal right"><a href="/diario/economia/index-2011-08-26.html" title="">ECONOMIA</a></div>
<div class="desplegable_boton boton_cerrar" onclick="_toggle('indice_economia')" id="boton_indice_economia">&nbsp;indice</div>
I've tried differente options, but the sections aren't detected (and also the articles, but let's put that aside from now).

Any ideas?

Last edited by macpablus; 08-28-2011 at 11:47 PM.
macpablus is offline   Reply With Quote
Old 08-29-2011, 11:30 AM   #2
Starson17
Wizard
Starson17 can program the VCR without an owner's manual.Starson17 can program the VCR without an owner's manual.Starson17 can program the VCR without an owner's manual.Starson17 can program the VCR without an owner's manual.Starson17 can program the VCR without an owner's manual.Starson17 can program the VCR without an owner's manual.Starson17 can program the VCR without an owner's manual.Starson17 can program the VCR without an owner's manual.Starson17 can program the VCR without an owner's manual.Starson17 can program the VCR without an owner's manual.Starson17 can program the VCR without an owner's manual.
 
Posts: 4,004
Karma: 177841
Join Date: Dec 2009
Device: WinMo: IPAQ; Android: HTC HD2, Archos 7o; Java:Gravity T
Quote:
Originally Posted by macpablus View Post
Any ideas?
Try this:
Code:
for section in soup.findAll('div', attrs={'class':'seccionx'}):
    section_title = self.tag_to_string(section.find('a'))
That should find the first <a> tag in the each div of class seccionx.

I looked at your links, but didn't actually see the structure you posted, so you'll have to test it yourself. Firefox and FireBug work well for this job.
Starson17 is offline   Reply With Quote
Advert
Old 08-30-2011, 12:09 AM   #3
macpablus
Enthusiast
macpablus once ate a cherry pie in a record 7 seconds.macpablus once ate a cherry pie in a record 7 seconds.macpablus once ate a cherry pie in a record 7 seconds.macpablus once ate a cherry pie in a record 7 seconds.macpablus once ate a cherry pie in a record 7 seconds.macpablus once ate a cherry pie in a record 7 seconds.macpablus once ate a cherry pie in a record 7 seconds.macpablus once ate a cherry pie in a record 7 seconds.macpablus once ate a cherry pie in a record 7 seconds.macpablus once ate a cherry pie in a record 7 seconds.macpablus once ate a cherry pie in a record 7 seconds.
 
Posts: 25
Karma: 1896
Join Date: Aug 2011
Device: Kindle 3
Thanks Starson!

Quote:
Originally Posted by Starson17 View Post
Try this:
Code:
for section in soup.findAll('div', attrs={'class':'seccionx'}):
    section_title = self.tag_to_string(section.find('a'))
That should find the first <a> tag in the each div of class seccionx.
Tried that, but nothing happens. The thing that puzzles me is that I cannot have ANY "hits" (aka, section detected), no matter what. For instance, I tried with...

Quote:
for section in soup.findAll('li'):
...and again, nothing:

Spoiler:
Code:
1% Converting input to HTML...
InputFormatPlugin: Recipe Input running
1% Fetching feeds...
1% Got feeds from index page
Python function terminated unexpectedly
  No articles found, aborting (Error Code: 1)
Traceback (most recent call last):
  File "site.py", line 132, in main
  File "site.py", line 109, in run_entry_point
  File "site-packages\calibre\ebooks\conversion\cli.py", line 286, in main
  File "site-packages\calibre\ebooks\conversion\plumber.py", line 937, in run
  File "site-packages\calibre\customize\conversion.py", line 204, in __call__
  File "site-packages\calibre\web\feeds\input.py", line 105, in convert
  File "site-packages\calibre\web\feeds\news.py", line 737, in download
  File "site-packages\calibre\web\feeds\news.py", line 882, in build_index
ValueError: No articles found, aborting


Here's the complete recipe (with your suggestion):

Spoiler:
Code:
#!/usr/bin/env  python

__license__   = 'GPL v3'
__copyright__ = '2008, Kovid Goyal <kovid at kovidgoyal.net>'
'''
pagina12.com.ar
'''
import re

from calibre.web.feeds.news import BasicNewsRecipe
from calibre.ebooks.BeautifulSoup import Tag, NavigableString

class Pagina12(BasicNewsRecipe):

    title      = 'Pagina12'
    __author__ = 'Juan De Los Palotes'
    description = 'Una solucion europea a los problemas argentinos'
    INDEX = 'http://www.pagina12.com.ar/diario/secciones/'
    language = 'es'

    #remove_tags_before = dict(id='menu_rosario') 
    #remove_tags_after  = dict(id='suples')
    #remove_tags        = [dict(id=['header', 'printAds', 'pageControls'])]
    no_stylesheets = True

    preprocess_regexps = [(re.compile(r'<!--.*?-->', re.DOTALL), lambda m: '')]


    #def print_version(self, url):
    #    return url.replace('/archive/', '/print/')

    def parse_index(self):
        articles = []
        numero = 1
        soup = self.index_to_soup(self.INDEX)
        #ts = soup.find(id='magazineTopStories')
        #ds = self.tag_to_string(ts.find('h1')).split(':')[-1]
        #self.timefmt = ' [%s]'%ds

        cover = soup.find('img', src=True, attrs={'class':'cover'})
        if cover is not None:
            self.cover_url = cover['src']

        feeds = []
        seen_titles = set([])
        for section in soup.findAll('div', attrs={'class':'seccionx'}):
            section_title = self.tag_to_string(section.find('a'))
            numero+=1
            print (numero)
            self.log('Found section:', section_title)
            articles = []
            for post in section.findAll('div', attrs={'class':lambda x : x and
                'post' in x}):
                h = post.find('h3')
                title = self.tag_to_string(h)
                if title in seen_titles:
                    continue
                seen_titles.add(title)
                a = post.find('a', href=True)
                url = a['href']
                if url.startswith('/'):
                    url = 'http://www.pagina12.com.ar'+url
                p = post.find('p', attrs={'class':'dek'})
                desc = None
                self.log('\tFound article:', title, 'at', url)
                if p is not None:
                    desc = self.tag_to_string(p)
                    self.log('\t\t', desc)
                articles.append({'title':title, 'url':url, 'description':desc,
                    'date':''})
            if articles:
                feeds.append((section_title, articles))

        return feeds

    def postprocess_html(self, soup, first):
        for table in soup.findAll('table', align='right'):
            img = table.find('img')
            if img is not None:
                img.extract()
                caption = self.tag_to_string(table).strip()
                div = Tag(soup, 'div')
                div['style'] = 'text-align:center'
                div.insert(0, img)
                div.insert(1, Tag(soup, 'br'))
                if caption:
                    div.insert(2, NavigableString(caption))
                table.replaceWith(div)

        return soup


And the HTML for the index page:
Spoiler:

Code:
<?xml version="1.0" encoding="ISO-8859-1"?>
<!DOCTYPE html 
	PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN
	"http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="es" lang="es">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1" />
<meta http-equiv="Pragma" content="no-cache" />
<meta http-equiv="Expires" content="-1" />
<meta name="robots" content="noarchive" />
<meta name="description" content="P&aacute;gina/12 Web" />
<meta name="keywords" content="p&aacute;gina/12, p&aacute;gina12, p&aacute;gina, 12, diario, argentina, noticias, pol&iacute;tica, econom&iacute;a, deportes, cultura, espect&aacute;culos, internacional, ciencia, &uacute;ltimas noticias, las12, radar, supleno, m2, newspaper, news, politics, business, sport, culture, entertainment, international, world, science" />
<meta name="copyright" content="2000-2011 P&aacute;gina/12" />

<meta name="_created_by" content="192.168.12.102" />
<meta name="_served_by" content="192.168.12.102" />
<meta name="_date_creation" content="Mon, 29 Aug 2011 21:31:32 -0300" />
<meta name="_revision" content="2285" />
<link rel="shortcut icon" href="/favicon.ico" type="image/x-icon" />

<link rel="icon" href="/favicon.ico" type="image/x-icon" />

<script type="text/javascript" src="/commons/js/prototype.js"></script>
<script type="text/javascript" src="/commons/js/pag12.js"></script>
<script type="text/javascript" src="/commons/js/clippings.js"></script>

<link rel="stylesheet" href="/commons/css/base.css" type="text/css" />
<link rel="stylesheet" href="/commons/css/clippings.css" type="text/css" />

<link rel="alternate" type="application/rss+xml" title="RSS" href="/diario/rss/principal.xml" />

<title>P&aacute;gina/12</title>

</head>

<body onload="clippings.load_cookie()">

<div id="contenedor_principal">

	 
	
			<div><script language="JavaScript" src="http://ads.pagina12.com.ar/banner.php?s=102&w=232&h=60&t=_blank&cla=bannerp10%20fright%20right12"></script></div>
	<div><script language="JavaScript" src="http://ads.pagina12.com.ar/banner.php?s=103&w=232&h=60&t=_blank&cla=bannerp10%20fright%20right12"></script></div>
	<div><script language="JavaScript" src="http://ads.pagina12.com.ar/banner.php?s=110&w=476&h=60&t=_blank&cla=bannerp10%20fright%20right12"></script></div>
			






					


<div id="logo">

	<a href="/" title="P&aacute;gina/12 Web"><img src="/commons/imgs/logo-home.gif" alt="P&aacute;gina/12"/></a>

	<p id="fecha_logo">

		<a href="/diario/principal/index-2011-08-28.html" title="Edici&oacute;n anterior"><img src="/commons/imgs/ed_anterior.gif" alt="anterior"></a>

		<img src="/commons/imgs/ed_palito.gif" alt="|" />
		<img src="/commons/imgs/ed_siguiente_off.gif" alt="siguiente deshabilitado" />&nbsp;
					Lunes, 29 de agosto de 2011
		
				
	</p>

</div>



	<div class="clear"></div>

		
	<div id="pre_menu">
		<ul>
			<li id="menu_usuario_1" class="fff"></li><li id="menu_usuario_2" class="fff"></li><li><a href="/usuarios/anteriores.php" class="curva1" title="Seleccione desde un almanaque la edici&oacute;n que desea"><img src="/commons/imgs/ico-anteriores.gif" />&nbsp;&nbsp;Ediciones anteriores</a></li><li><a href="/buscador/index.php" title="B&uacute;squeda por secci&oacute;n/suple"><img src="/commons/imgs/ico-buscar.gif" />&nbsp;&nbsp;Busqueda avanzada</a></li><li><a href="/usuarios/correo.php" title="Escriba desde aqu&iacute; a las distintas secciones/suples"><img src="/commons/imgs/ico-correo.gif" />&nbsp;&nbsp;Correo</a></li><li><a href="http://www.kiosco12.com/" title="Venta de productos P&aacute;gina/12"><img style="padding-top:4px" src="/commons/imgs/ico-kiosco.gif" />&nbsp;&nbsp;Kiosco|12</a></li>

		</ul>
	</div>
	<script type="text/javascript">
		//<![CDATA[
		user.menu();
		//]]>
	</script>		
	
	
	
	<script type="text/javascript">
		//<![CDATA[
		var active_menu='secciones';
		//]]>
	</script>

	<div id="menu">

			
			
			<div id="buscar"><form action="/buscador/resultado.php" method="get" id="form_search" name="form_search"><a href="javascript:;" onclick="$('form_search').submit(); return false;" title=""><img src="/commons/imgs/buscar-bot.gif" alt="buscar"/></a>&nbsp;<input type="text" name="q" id="input_search" /></form></div>

			
			<div style="margin-left:20px"><a href="/diario/ultimas/index.html" title="Ultimas Noticias del 29-08-2011" id="boton_ultimas" class="" onmouseover="menu_select('ultimas','button')" onmouseout="menu_hide()"><span>Ultimas Noticias</span></a></div>

						
			<a href="/diario/principal/index.html" title="Acceso a Edici&oacute;n Impresa" id="boton_secciones" class="sep menuon" onmouseover="menu_select('secciones','button')" onmouseout="menu_hide()"><span>Edicion Impresa</span></a>

			
			<a href="javascript:;" title="Abrir" id="select_secciones" class="select menuon" onclick="menu_toggle('secciones')" onmouseover="menu_select('secciones','select')" onmouseout="menu_hide()"><span><img src="/commons/imgs/abrir3.gif" alt="abrir"/></span></a>

			
			
			<a href="/diario/suplementos/index.html" title="Portada de Suplementos" id="boton_suplementos" class="sep" onmouseover="menu_select('suplementos','button')" onmouseout="menu_hide()"><span>Suplementos</span></a>
			
			
			<a href="javascript:;" title="Abrir" id="select_suplementos" class="select" onclick="menu_toggle('suplementos')" onmouseover="menu_select('suplementos','select')" onmouseout="menu_hide()"><span><img src="/commons/imgs/abrir3.gif" alt="abrir"/></span></a>

			
			<a href="/diario/principal/diario/index.html" title="Tapas" id="boton_tapas" class="sep" onmouseover="menu_select('tapas','button')" onmouseout="menu_hide()"><span>Tapas</span></a>

			
			
			 

			
			<a href="/diario/suplementos/rosario/index.html" title="Rosario/12" id="boton_rosario" class="sep" onmouseover="menu_select('rosario','button')" onmouseout="menu_hide()"><span>Rosario/12</span></a>

			
			

			
			<a href="http://blogs.pagina12.com.ar/revistafierro/" title="Revista Fierro, la historieta argentina" id="boton_fierro" class="sep" onmouseover="menu_select('fierro','button')" onmouseout="menu_hide()"><span>Fierro</span></a>

			
			<a href="/futbol/index.html" title="F&uacute;tbol en vivo" id="boton_futbol" class="sep" onmouseover="menu_select('futbol','button')" onmouseout="menu_hide()"><span>Futbol en vivo</span></a>
			
	</div>
	

	
	<div id="submenu">

		<ul id="menu_secciones" >

			<li><a href="/diario/secciones/index.html" title="Indice de secciones" class="submenuon">Indice</a></li>
						<li><a href="/diario/elpais/index.html" title="El país" >EL PAIS</a></li>						<li><a href="/diario/economia/index.html" title="Economía" >ECONOMIA</a></li>						<li><a href="/diario/sociedad/index.html" title="Sociedad" >SOCIEDAD</a></li>						<li><a href="/diario/cdigital/index.html" title="Cultura Digital" >CULTURA DIGITAL</a></li>						<li><a href="/diario/laventana/index.html" title="La ventana" >LA VENTANA</a></li>						<li><a href="/diario/elmundo/index.html" title="El mundo" >EL MUNDO</a></li>						<li><a href="/diario/suplementos/espectaculos/index.html" title="Espect&aacute;culos" >ESPECTACULOS</a></li>						<li><a href="/diario/dialogos/index.html" title="Dialogos" >DIALOGOS</a></li>						<li><a href="/diario/psicologia/index.html" title="Psicología" >PSICOLOGIA</a></li>												<li><a href="/diario/universidad/index.html" title="Universidad" >UNIVERSIDAD</a></li>						<li><a href="/diario/contratapa/index.html" title="Contratapa" >CONTRATAPA</a></li>						<li><a href="/diario/cartas/index.html" title="Cartas de lectores" >CARTAS DE LECTORES</a></li>						<li><a href="/diario/pirulo/index.html" title="Pirulo de tapa" >PIRULO DE TAPA</a></li>					</ul>

		<ul id="menu_suplementos" style="display:none">

						<li class="lradar"><a href="/diario/suplementos/radar/index.html" title="Radar" >Radar</a></li>
			
						<li class="llibros"><a href="/diario/suplementos/libros/index.html" title="Radar Libros" >Radar Libros</a></li>
			
						<li class="lcash"><a href="/diario/suplementos/cash/index.html" title="Cash" >Cash</a></li>
			
						<li class="lturismo"><a href="/diario/suplementos/turismo/index.html" title="Turismo" >Turismo</a></li>
			
						<li class="llibero"><a href="/diario/suplementos/libero/index.html" title="L&iacute;bero" >Libero</a></li>

			
						<li class="lno"><a href="/diario/suplementos/no/index.html" title="NO" >NO</a></li>
			
						<li class="llas12"><a href="/diario/suplementos/las12/index.html" title="Las12" >Las12</a></li>
			
						<li class="lfuturo"><a href="/diario/suplementos/futuro/index.html" title="Futuro" >Futuro</a></li>
			
						<li class="lm2"><a href="/diario/suplementos/m2/index.html" title="M2" >M2</a></li>
			
						<li class="lsoy"><a href="/diario/suplementos/soy/index.html" title="Soy" >Soy</a></li>
			
						<li class="lsatira"><a href="/diario/suplementos/satira/index.html" title="S&aacute;tira12" >Satira12</a></li>

			
			<li class="lcommon"><a href="/especiales/index.php" title="Especiales" >Especiales</a></li>

			<li class="lcommon"><a href="javascript:;" onclick="openGallery()" title="Fotogaler&iacute;a">Fotogaleria</a></li>

		</ul>

		<ul id="menu_tapas" style="display:none">
			
			<li><a href="/diario/principal/diario/index-2011-08-28.html">&larr;&nbsp;Anterior&nbsp;(28-08-2011)</a></li>

					</ul>

		
		

		<ul id="menu_rosario" style="display:none">
					</ul>

	</div>
		
	<div class="separador"/>

		<div class="columna476 left12" >

		<h1 class="titulo_bloque bottom3 top12">INDICE COMPLETO EDICION IMPRESA</h1>

				
		<div class="seccionx">

			<div class="desplegable_titulo on_principal right"><a href="/diario/elpais/index.html" title="">EL PAIS</a></div>
			<div class="desplegable_boton boton_cerrar" onclick="_toggle('indice_elpais')" id="boton_indice_elpais">&nbsp;indice</div>

			<div id="indice_elpais">
			
			<ul>
								<li>

										<p class="volanta">EL GOBERNADOR KIRCHNERISTA DE TUCUMAN CONSIGUIO SU TERCER MANDATO CON EL 73 POR CIENTO DE LOS VOTOS</p>					<h2><a href="/diario/elpais/1-175599-2011-08-29.html">Un jardín para la reelección de Alperovich</a></h2>
					<p class="autor">Por Julián Bruschtein</p>				</li>
								<li>
										<p class="volanta">OPINION</p>					<h2><a href="/diario/elpais/1-175600-2011-08-29.html">Oficialismos en racha</a></h2>
					<p class="autor">Por Mario Wainfeld</p>				</li>

								<li>
										<p class="volanta">EL RADICAL FUE REELECTO AYER EN LA CAPITAL DE LA PROVINCIA</p>					<h2><a href="/diario/elpais/1-175593-2011-08-29.html">Se va la tercera para Fayad en Mendoza</a></h2>
									</li>
								<li>
										<p class="volanta">OPINION</p>					<h2><a href="/diario/elpais/1-175594-2011-08-29.html">Andanzas mediáticas</a></h2>
					<p class="autor">Por Eduardo Aliverti</p>				</li>

								<li>
										<p class="volanta">LAS ESPECULACIONES SOBRE POSIBLES MINISTROS EN UN NUEVO MANDATO DE LA PRESIDENTA</p>					<h2><a href="/diario/elpais/1-175585-2011-08-29.html">Nombres para un futuro gabinete de CFK</a></h2>
					<p class="autor">Por Nicolás Lantos</p>				</li>
								<li>
										<p class="volanta">EL RECAMBIO QUE SE VIENE EN EL CONGRESO TRAS LAS ELECCIONES</p>					<h2><a href="/diario/elpais/1-175567-2011-08-29.html">Los que entran, los que se quedan y los que se van</a></h2>

					<p class="autor">Por Miguel Jorquera</p>				</li>
								<li>
										<p class="volanta">OPINION</p>					<h2><a href="/diario/elpais/1-175568-2011-08-29.html">Riesgos</a></h2>
					<p class="autor">Por Mario de Casas</p>				</li>
								<li>

										<p class="volanta">LA DECLARACION DE CLAUDIA POBLETE EN EL JUICIO POR LA APROPIACION DE BEBES</p>					<h2><a href="/diario/elpais/1-175595-2011-08-29.html">El rearmado de la historia personal</a></h2>
					<p class="autor">Por Alejandra Dandan</p>				</li>
								<li>
															<h2><a href="/diario/elpais/1-175596-2011-08-29.html">Encuentro en el Olimpo</a></h2>
									</li>
								<li>

										<p class="volanta">LA POLICIA REPRIMIO UNA PROTESTA DE PETROLEROS</p>					<h2><a href="/diario/elpais/1-175597-2011-08-29.html">Huelga e incidentes en Caleta Olivia</a></h2>
									</li>
							</ul>

			</div>

		</div>
		
				
		<div class="seccionx">

			<div class="desplegable_titulo on_principal right"><a href="/diario/economia/index.html" title="">ECONOMIA</a></div>
			<div class="desplegable_boton boton_cerrar" onclick="_toggle('indice_economia')" id="boton_indice_economia">&nbsp;indice</div>

			<div id="indice_economia">
			
			<ul>
								<li>
										<p class="volanta">MACRI AVALO OTRA SUBA EN LOS PEAJES DE LA CIUDAD</p>					<h2><a href="/diario/economia/2-175569-2011-08-29.html">Sin barrera para los aumentos</a></h2>

					<p class="autor">Por Fernando Krakowiak</p>				</li>
								<li>
										<p class="volanta">ESTE AñO SE PRODUCIRAN 115 MILLONES DE PARES DE CALZADO</p>					<h2><a href="/diario/economia/2-175563-2011-08-29.html">Un sector que pisa fuerte</a></h2>
					<p class="autor">Por Javier Lewkowicz</p>				</li>
								<li>

										<p class="volanta">TEMAS DE DEBATE: EL MAPA DE LO QUE VENDE ARGENTINA</p>					<h2><a href="/diario/economia/2-175562-2011-08-29.html">Radiografía de las exportaciones</a></h2>
									</li>
								<li>
															<h2><a href="/diario/economia/2-175570-2011-08-29.html">Inauguran el tren a Uruguay</a></h2>
									</li>
								<li>
															<h2><a href="/diario/economia/2-175564-2011-08-29.html">“Refleja madurez”</a></h2>

									</li>
								<li>
															<h2><a href="/diario/economia/2-175565-2011-08-29.html">Cementeras con ganancias</a></h2>
									</li>
								<li>
															<h2><a href="/diario/economia/2-175571-2011-08-29.html">“Límites a la especulación”</a></h2>
									</li>
								<li>

															<h2><a href="/diario/economia/2-175572-2011-08-29.html">Reunión de ministros</a></h2>
									</li>
							</ul>

			</div>

		</div>
		
				
		<div class="seccionx">

			<div class="desplegable_titulo on_principal right"><a href="/diario/sociedad/index.html" title="">SOCIEDAD</a></div>

			<div class="desplegable_boton boton_cerrar" onclick="_toggle('indice_sociedad')" id="boton_indice_sociedad">&nbsp;indice</div>

			<div id="indice_sociedad">
			
			<ul>
								<li>
										<p class="volanta">EL PROGRAMA QUE APUNTALA LA IDENTIDAD DE INDIGENAS Y CAMPESINOS</p>					<h2><a href="/diario/sociedad/3-175566-2011-08-29.html">Un Nativo para no deforestar</a></h2>
									</li>

								<li>
										<p class="volanta">SE DETECTAN MAS CASOS DE ESCHERICHIA COLI ENTRE LOS PORTEñOS</p>					<h2><a href="/diario/sociedad/3-175573-2011-08-29.html">Un síndrome que va en aumento</a></h2>
					<p class="autor">Por Pedro Lipcovich</p>				</li>
								<li>
										<p class="volanta">LA METROPOLITANA CLAUSURO UNA DISCO</p>					<h2><a href="/diario/sociedad/3-175574-2011-08-29.html">El Edén era un infierno</a></h2>

									</li>
								<li>
										<p class="volanta">EN HURLINGHAM VOLVIERON A PEDIR POR ELLA MIENTRAS SIGUE LA BUSQUEDA</p>					<h2><a href="/diario/sociedad/3-175579-2011-08-29.html">Otra marcha por Candela</a></h2>
									</li>
								<li>
															<h2><a href="/diario/sociedad/3-175580-2011-08-29.html">Rescatadas de la trata</a></h2>
									</li>

								<li>
															<h2><a href="/diario/sociedad/3-175581-2011-08-29.html">Juicio por Sonia Colman</a></h2>
									</li>
								<li>
															<h2><a href="/diario/sociedad/3-175575-2011-08-29.html">Dos Embraer para Austral</a></h2>
									</li>
								<li>
															<h2><a href="/diario/sociedad/3-175576-2011-08-29.html">El Dorrego, un notable</a></h2>

									</li>
								<li>
															<h2><a href="/diario/sociedad/3-175577-2011-08-29.html">No quieren el shopping</a></h2>
									</li>
								<li>
															<h2><a href="/diario/sociedad/3-175578-2011-08-29.html">“Que no se lave las manos”</a></h2>
									</li>
								<li>

															<h2><a href="/diario/sociedad/3-175582-2011-08-29.html">Para buscar a Sandra</a></h2>
									</li>
							</ul>

			</div>

		</div>
		
				
		<div class="seccionx">

			<div class="desplegable_titulo on_principal right"><a href="/diario/cdigital/index.html" title="">CULTURA DIGITAL</a></div>

			<div class="desplegable_boton boton_cerrar" onclick="_toggle('indice_cdigital')" id="boton_indice_cdigital">&nbsp;indice</div>

			<div id="indice_cdigital">
			
			<ul>
								<li>
										<p class="volanta">ENTREVISTA A ANDREW MCLAUGHLIN, EX GOOGLE Y EX ASESOR DE BARACK OBAMA</p>					<h2><a href="/diario/cdigital/31-175088-2011-08-29.html">“Los gobiernos tienen que pensar en cómo proteger su información”</a></h2>
					<p class="autor">Por Mariano Blejman</p>				</li>

								<li>
										<p class="volanta">EXPERIENCIA ENDEAVOR</p>					<h2><a href="/diario/cdigital/31-175089-2011-08-29.html">La nueva era digital</a></h2>
									</li>
								<li>
										<p class="volanta">DEDOS > LANZAMIENTOS - GADGETS - NOTICIAS</p>					<h2><a href="/diario/cdigital/31-175090-2011-08-29.html">Netflix desembarcado</a></h2>
									</li>

								<li>
										<p class="volanta">DEDOS > LANZAMIENTOS - GADGETS - NOTICIAS</p>					<h2><a href="/diario/cdigital/31-175091-2011-08-29.html">Nic.Ly hackeado</a></h2>
									</li>
								<li>
										<p class="volanta">DEDOS > LANZAMIENTOS - GADGETS - NOTICIAS</p>					<h2><a href="/diario/cdigital/31-175092-2011-08-29.html">Twitter incorpora imágenes</a></h2>
									</li>

							</ul>

			</div>

		</div>
		
				
		<div class="seccionx">

			<div class="desplegable_titulo on_principal right"><a href="/diario/suplementos/espectaculos/index-2011-08-29.html" title="">CULTURA Y ESPECTACULOS</a></div>
			<div class="desplegable_boton boton_cerrar" onclick="_toggle('indice_espectaculos')" id="boton_indice_espectaculos">&nbsp;indice</div>

			<div id="indice_espectaculos">
			
			<ul>
								<li>
										<p class="volanta"></p>					<h2><a href="/diario/suplementos/espectaculos/4-22737-2011-08-29.html">“Me doy cuenta de que puedo jugar con mis síntomas”</a></h2>
					<p class="autor">Por Silvina Friera</p>				</li>
								<li>

										<p class="volanta"></p>					<h2><a href="/diario/suplementos/espectaculos/17-22731-2011-08-29.html">Del renegao al motochorro</a></h2>
					<p class="autor">Por Facundo García</p>				</li>
								<li>
										<p class="volanta"></p>					<h2><a href="/diario/suplementos/espectaculos/3-22732-2011-08-29.html">Cultura rock en el País de Nunca Jamás</a></h2>
					<p class="autor">Por Luis Paz</p>				</li>

								<li>
										<p class="volanta"></p>					<h2><a href="/diario/suplementos/espectaculos/3-22733-2011-08-29.html">El peregrino regresó al templo</a></h2>
					<p class="autor">Por Juan Ignacio Provéndola</p>				</li>
								<li>
										<p class="volanta"></p>					<h2><a href="/diario/suplementos/espectaculos/2-22743-2011-08-29.html">Periodismo y compromiso</a></h2>
									</li>

								<li>
															<h2><a href="/diario/suplementos/espectaculos/2-22734-2011-08-29.html">Milanés en Miami</a></h2>
									</li>
								<li>
															<h2><a href="/diario/suplementos/espectaculos/2-22735-2011-08-29.html">Mundial de tango</a></h2>
									</li>
								<li>
															<h2><a href="/diario/suplementos/espectaculos/2-22738-2011-08-29.html">Encuentro con Foucault</a></h2>

									</li>
								<li>
															<h2><a href="/diario/suplementos/espectaculos/2-22739-2011-08-29.html">El gusto musical</a></h2>
									</li>
								<li>
															<h2><a href="/diario/suplementos/espectaculos/2-22740-2011-08-29.html">Retrato de una adolescente</a></h2>
									</li>
								<li>

															<h2><a href="/diario/suplementos/espectaculos/2-22741-2011-08-29.html">Las viudas de Updike</a></h2>
									</li>
								<li>
															<h2><a href="/diario/suplementos/espectaculos/2-22742-2011-08-29.html">Cartas desde el horror</a></h2>
									</li>
								<li>
															<h2><a href="/diario/suplementos/espectaculos/15-22736-2011-08-29.html">VISTO & OIDO</a></h2>

									</li>
							</ul>

			</div>

		</div>
		
				
		<div class="seccionx">

			<div class="desplegable_titulo on_principal right"><a href="/diario/laventana/index.html" title="">LA VENTANA</a></div>
			<div class="desplegable_boton boton_cerrar" onclick="_toggle('indice_laventana')" id="boton_indice_laventana">&nbsp;indice</div>

			<div id="indice_laventana">
			
			<ul>
								<li>
										<p class="volanta">MEDIOS Y COMUNICACION</p>					<h2><a href="/diario/laventana/26-175204-2011-08-29.html">Neutralidad de la red en debate</a></h2>
					<p class="autor">Por Ornella Carboni * y Carla Rodríguez Miranda **</p>				</li>
								<li>

										<p class="volanta">MEDIOS Y COMUNICACION</p>					<h2><a href="/diario/laventana/26-175205-2011-08-29.html">Escribir y publicar</a></h2>
					<p class="autor">Por Sergio Kisielewsky</p>				</li>
								<li>
															<h2><a href="/diario/laventana/26-175207-2011-08-29.html">Escondido en mi país</a></h2>
									</li>
							</ul>

			</div>

		</div>
		
				
		<div class="seccionx">

			<div class="desplegable_titulo on_principal right"><a href="/diario/elmundo/index.html" title="">EL MUNDO</a></div>
			<div class="desplegable_boton boton_cerrar" onclick="_toggle('indice_elmundo')" id="boton_indice_elmundo">&nbsp;indice</div>

			<div id="indice_elmundo">

			
			<ul>
								<li>
										<p class="volanta">LOS INDIGNADOS ESPAñOLES CRITICAN EL ACUERDO ENTRE EL OFICIALISMO Y LA OPOSICION</p>					<h2><a href="/diario/elmundo/4-175583-2011-08-29.html">En la calle contra el cambio constitucional</a></h2>
					<p class="autor">Por Adrián Pérez</p>				</li>
								<li>
										<p class="volanta">OPINION</p>					<h2><a href="/diario/elmundo/4-175584-2011-08-29.html">La lengua de las mariposas</a></h2>

					<p class="autor">Por Fernando Peirone</p>				</li>
								<li>
										<p class="volanta">DEJO 18 MUERTOS EN ESTADOS UNIDOS, HASTA QUE DESCENDIO A TORMENTA TROPICAL</p>					<h2><a href="/diario/elmundo/4-175586-2011-08-29.html">Irene, al paso tranco por Nueva York</a></h2>
									</li>
								<li>
										<p class="volanta">LOS UNIVERSITARIOS CHILENOS SE REUNIRAN CON EL PRESIDENTE EN LA MONEDA MAñANA: RECHAZAN LAS PROPUESTAS DE EDUCACION</p>					<h2><a href="/diario/elmundo/4-175587-2011-08-29.html">Diálogo para que Piñera aprenda la lección</a></h2>

									</li>
								<li>
										<p class="volanta">TESTIMONIO EN LA CAUSA BACHELET</p>					<h2><a href="/diario/elmundo/4-175588-2011-08-29.html">Los que lo torturaron</a></h2>
									</li>
								<li>
										<p class="volanta">EN PERU HABRA QUE CONSULTAR A LAS COMUNIDADES EN PROYECTOS CON TIERRAS</p>					<h2><a href="/diario/elmundo/4-175589-2011-08-29.html">Una ley a favor de los indígenas</a></h2>

					<p class="autor">Por Carlos Noriega</p>				</li>
								<li>
										<p class="volanta">EL VOCERO DEL CORONEL LIBIO PIDIO DISCUTIR LA TRANSICION; LOS INSURGENTES QUIEREN QUE SE ENTREGUE</p>					<h2><a href="/diario/elmundo/4-175590-2011-08-29.html">Los rebeldes no negocian con Khadafi</a></h2>
									</li>
							</ul>

			</div>

		</div>
		
				
		<div class="seccionx">

			<div class="desplegable_titulo on_principal right"><a href="/diario/dialogos/index.html" title="">DIALOGOS</a></div>
			<div class="desplegable_boton boton_cerrar" onclick="_toggle('indice_dialogos')" id="boton_indice_dialogos">&nbsp;indice</div>

			<div id="indice_dialogos">
			
			<ul>

								<li>
										<p class="volanta">LOS ORIGENES Y EL FUTURO DEL 15-M ESPAñOL SEGUN AMADOR FERNANDEZ-SAVATER</p>					<h2><a href="/diario/dialogos/21-175561-2011-08-29.html">Después de la Puerta del Sol</a></h2>
					<p class="autor">Por Veronica Gago</p>				</li>
							</ul>

			</div>

		</div>
		
				
		<div class="seccionx">

			<div class="desplegable_titulo on_principal right"><a href="/diario/psicologia/index.html" title="">PSICOLOGIA</a></div>
			<div class="desplegable_boton boton_cerrar" onclick="_toggle('indice_psicologia')" id="boton_indice_psicologia">&nbsp;indice</div>

			<div id="indice_psicologia">
			
			<ul>
								<li>

										<p class="volanta">“PREPARACION PARA LA ANCIANIDAD”</p>					<h2><a href="/diario/psicologia/9-175259-2011-08-29.html">Aquellos viejos sabios</a></h2>
					<p class="autor">Por Enrique Rozitchner</p>				</li>
								<li>
															<h2><a href="/diario/psicologia/9-175260-2011-08-29.html">Posdata</a></h2>
									</li>
							</ul>

			</div>

		</div>
		
				
		<div class="seccionx">

			<div class="desplegable_titulo on_principal right"><a href="/diario/universidad/index.html" title="">UNIVERSIDAD</a></div>
			<div class="desplegable_boton boton_cerrar" onclick="_toggle('indice_universidad')" id="boton_indice_universidad">&nbsp;indice</div>

			<div id="indice_universidad">

			
			<ul>
								<li>
										<p class="volanta">DESDE HOY Y HASTA EL DOMINGO SE REALIZAN LAS ACTIVIDADES CENTRALES</p>					<h2><a href="/diario/universidad/10-175351-2011-08-29.html">La UBA festeja sus primeros 190</a></h2>
									</li>
								<li>
															<h2><a href="/diario/universidad/10-175352-2011-08-29.html">Agenda</a></h2>
									</li>

								<li>
															<h2><a href="/diario/universidad/10-175353-2011-08-29.html">El número de graduados</a></h2>
									</li>
								<li>
										<p class="volanta">DE LA TEORIA A LA PRACTICA POLITICA > DOS REFLEXIONES SOBRE EL ROL DE LOS INTELECTUALES EN LA VIDA PUBLICA</p>					<h2><a href="/diario/universidad/10-175117-2011-08-29.html">Escollos y desafíos</a></h2>
					<p class="autor">Por Emilio De Ipola</p>				</li>

								<li>
										<p class="volanta">DE LA TEORIA A LA PRACTICA POLITICA > DOS REFLEXIONES SOBRE EL ROL DE LOS INTELECTUALES EN LA VIDA PUBLICA</p>					<h2><a href="/diario/universidad/10-175118-2011-08-29.html">La función intelectual</a></h2>
					<p class="autor">Por José Nun</p>				</li>
							</ul>

			</div>

		</div>
		
				
		<div class="seccionx">

			<div class="desplegable_titulo on_principal right"><a href="/diario/contratapa/index.html" title="">CONTRATAPA</a></div>
			<div class="desplegable_boton boton_cerrar" onclick="_toggle('indice_contratapa')" id="boton_indice_contratapa">&nbsp;indice</div>

			<div id="indice_contratapa">
			
			<ul>
								<li>

										<p class="volanta">ARTE DE ULTIMAR</p>					<h2><a href="/diario/contratapa/13-175591-2011-08-29.html">Ishi quiere decir “hombre”</a></h2>
					<p class="autor">Por Juan Sasturain</p>				</li>
							</ul>

			</div>

		</div>

		
				
		<div class="seccionx">

			<div class="desplegable_titulo on_principal right"><a href="/diario/cartas/index.html" title="">CARTAS DE LECTORES</a></div>
			<div class="desplegable_boton boton_cerrar" onclick="_toggle('indice_cartas')" id="boton_indice_cartas">&nbsp;indice</div>

			<div id="indice_cartas">
			
			<ul>
								<li>
															<h2><a href="/diario/cartas/24-175592-2011-08-29.html">Agradecimiento al PAMI</a></h2>

									</li>
							</ul>

			</div>

		</div>
		
				
		<div class="seccionx">

			<div class="desplegable_titulo on_principal right"><a href="/diario/pirulo/index.html" title="">PIRULO DE TAPA</a></div>
			<div class="desplegable_boton boton_cerrar" onclick="_toggle('indice_pirulo')" id="boton_indice_pirulo">&nbsp;indice</div>

			<div id="indice_pirulo">
			
			<ul>
								<li>
															<h2><a href="/diario/pirulo/30-175598-2011-08-29.html">ANTIPAPA</a></h2>
									</li>
							</ul>

			</div>

		</div>
		
		
	</div>
	
		<div class="columna232 left12">

		


											


<div id="suples" class="top12">

	<h1 class="titulo_bloque">
		<a href="/diario/suplementos/index.html" title="" class="ttitulo">SUPLEMENTOS</a>
	</h1>

	
				<!----->
		<div class="suple_hoy">

			<table>
				<tr>
					<td style="padding: 10px 3px 10px 3px">
						<a href="/diario/suplementos/libero/index.html" title=""><img src="http://www.pagina12.com.ar/fotos/libero/20110829/tapa_l/fotoacl.jpg" alt="" style="width:45px"/></a>
					</td>
					<td style="padding: 10px 6px 10px 6px">

						<p class="fecha">29-ago-2011</p>
						<h2 class="elibero">LIBERO</h2>
						<h3 class="hlibero">
														<a href="/diario/suplementos/libero/index.html" title="">LA PUNTA QUE LOS PARTIÓ</a>
													</h3>
												<p>Boca y San Lorenzo se rompieron mucho (y también se dieron leña) para llegar a la punta del Apertura, pero no...</p>
																		<ul>

														<li class="hlibero">
																<a href="/diario/suplementos/libero/10-6223-2011-08-29.html" title="">Clásico con velas, geishas y mucho color</a>
															</li>
														<li class="hlibero">
																<a href="/diario/suplementos/libero/10-6224-2011-08-29.html" title="">Empataron sin goles y sin ponerse colorados</a>
															</li>
														<li class="hlibero">
																<a href="/diario/suplementos/libero/10-6221-2011-08-29.html" title="">Unión hizo la fuerza; Colón, el papelón</a>

															</li>
														<li class="hlibero">
																<a href="/diario/suplementos/libero/10-6222-2011-08-29.html" title="">Newell’s supo cómo darlo vuelta</a>
															</li>
														<li class="hlibero">
																<a href="/diario/suplementos/libero/10-6214-2011-08-29.html" title="">En el Sur volvió a soplar</a>
															</li>
														<li class="hlibero">

																<a href="/diario/suplementos/libero/7-6216-2011-08-29.html" title="">Con todo el dolor del alma</a>
															</li>
														<li class="hlibero">
																<a href="/diario/suplementos/libero/11-6219-2011-08-29.html" title="">Tormenta de tenis</a>
															</li>
														<li class="hlibero">
																<a href="/diario/suplementos/libero/7-6217-2011-08-29.html" title="">Van 12, ganó siete, no lo para nadie</a>

															</li>
														<li class="hlibero">
																<a href="/diario/suplementos/libero/10-6215-2011-08-29.html" title="">Sexteto Real Madrid</a>
															</li>
														<li class="hlibero">
																<a href="/diario/suplementos/libero/9-6218-2011-08-29.html" title="">El papelón de Bolt</a>
															</li>
													</ul>

																	</td>
				</tr>
			</table>

		</div>
		<!----->
		
	
				<!----->
		<div class="suple">

			<p class="fecha">28-ago-2011</p>

			<h2 class="ecash">Cash</a></h2>
			<h3 class="hcash">
				<a href="/diario/suplementos/cash/index.html" title="">VAMOS LOS PIBES</a>
			</h3>
						<p class="font-size=11px"><strong>INFORME DE LA UNICEF</strong><br>
 El último relevamiento de la Unicef analiza los recursos orientados a los...</p>
									<ul>

								<li class="hcash">
					<a href="/diario/suplementos/cash/17-5408-2011-08-29.html" title="">.general</a>
				</li>
								<li class="hcash">
					<a href="/diario/suplementos/cash/17-5416-2011-08-29.html" title="">Balance positivo</a>
				</li>
								<li class="hcash">
					<a href="/diario/suplementos/cash/17-5417-2011-08-29.html" title="">Ventajas competitivas</a>

				</li>
								<li class="hcash">
					<a href="/diario/suplementos/cash/40-5418-2011-08-29.html" title="">“Consolidación y propuestas”</a>
				</li>
								<li class="hcash">
					<a href="/diario/suplementos/cash/28-5419-2011-08-29.html" title="">Moody’s logró la unión</a>
				</li>
								<li class="hcash">

					<a href="/diario/suplementos/cash/17-5420-2011-08-29.html" title="">“La furia está muy dispersa”</a>
				</li>
								<li class="hcash">
					<a href="/diario/suplementos/cash/45-5421-2011-08-29.html" title="">Efecto “baby boomers”</a>
				</li>
								<li class="hcash">
					<a href="/diario/suplementos/cash/33-5422-2011-08-29.html" title="">El mal ejemplo</a>

				</li>
								<li class="hcash">
					<a href="/diario/suplementos/cash/17-5423-2011-08-29.html" title="">La ruralidad y las PASO</a>
				</li>
								<li class="hcash">
					<a href="/diario/suplementos/cash/39-5409-2011-08-29.html" title="">el chiste</a>
				</li>
								<li class="hcash">

					<a href="/diario/suplementos/cash/39-5410-2011-08-29.html" title="">el libro</a>
				</li>
								<li class="hcash">
					<a href="/diario/suplementos/cash/39-5411-2011-08-29.html" title="">el acertijo</a>
				</li>
								<li class="hcash">
					<a href="/diario/suplementos/cash/39-5412-2011-08-29.html" title="">textual</a>

				</li>
								<li class="hcash">
					<a href="/diario/suplementos/cash/39-5413-2011-08-29.html" title="">cursos</a>
				</li>
								<li class="hcash">
					<a href="/diario/suplementos/cash/39-5414-2011-08-29.html" title="">la posta</a>
				</li>
								<li class="hcash">

					<a href="/diario/suplementos/cash/39-5415-2011-08-29.html" title="">¿cuáles?</a>
				</li>
							</ul>
			
		</div>
		<!----->
		
	
				<!----->
		<div class="suple">

			<p class="fecha">28-ago-2011</p>

			<h2 class="eradar">Radar</a></h2>
			<h3 class="hradar">
				<a href="/diario/suplementos/radar/index.html" title="">EL INGLÉS DE LOS GÜESOS</a>
			</h3>
						<p class="font-size=11px">Shakespeare en buenos aires: media docena de HAMLETs invaden los escenarios</p>
									<ul>
								<li class="hradar">

					<a href="/diario/suplementos/radar/9-7288-2011-08-29.html" title="">Los fabulosos calavera</a>
				</li>
								<li class="hradar">
					<a href="/diario/suplementos/radar/9-7287-2011-08-29.html" title="">El Chango peronista</a>
				</li>
								<li class="hradar">
					<a href="/diario/suplementos/radar/9-7289-2011-08-29.html" title="">Imberbes</a>

				</li>
								<li class="hradar">
					<a href="/diario/suplementos/radar/9-7290-2011-08-29.html" title="">Infiltrados</a>
				</li>
								<li class="hradar">
					<a href="/diario/suplementos/radar/9-7291-2011-08-29.html" title="">Heroína de la clase media</a>
				</li>
								<li class="hradar">

					<a href="/diario/suplementos/radar/9-7292-2011-08-29.html" title="">Quiero estar azulado</a>
				</li>
								<li class="hradar">
					<a href="/diario/suplementos/radar/9-7293-2011-08-29.html" title="">Muerte en Venecia</a>
				</li>
								<li class="hradar">
					<a href="/diario/suplementos/radar/9-7296-2011-08-29.html" title="">La agonia y el extasis</a>

				</li>
								<li class="hradar">
					<a href="/diario/suplementos/radar/9-7297-2011-08-29.html" title="">Bang Crash Boom</a>
				</li>
								<li class="hradar">
					<a href="/diario/suplementos/radar/17-7300-2011-08-29.html" title="">Abraham en Treblinka</a>
				</li>
								<li class="hradar">

					<a href="/diario/suplementos/radar/5-7284-2011-08-29.html" title="">Que la fuerza (de la moneda) te acompañe</a>
				</li>
								<li class="hradar">
					<a href="/diario/suplementos/radar/5-7285-2011-08-29.html" title="">Entre caníbales</a>
				</li>
								<li class="hradar">
					<a href="/diario/suplementos/radar/5-7286-2011-08-29.html" title="">El periodista sin techo</a>

				</li>
								<li class="hradar">
					<a href="/diario/suplementos/radar/5-7298-2011-08-29.html" title="">¡Eso es todo, amigos!</a>
				</li>
								<li class="hradar">
					<a href="/diario/suplementos/radar/15-7294-2011-08-29.html" title="">Inevitables</a>
				</li>
								<li class="hradar">

					<a href="/diario/suplementos/radar/18-7295-2011-08-29.html" title="">A merendar</a>
				</li>
								<li class="hradar">
					<a href="/diario/suplementos/radar/19-7299-2011-08-29.html" title="">F.Mérides Truchas</a>
				</li>
							</ul>
			
		</div>
		<!----->

		
	
				<!----->
		<div class="suple">

			<p class="fecha">28-ago-2011</p>
			<h2 class="elibros">Radar libros</a></h2>
			<h3 class="hlibros">
				<a href="/diario/suplementos/libros/index.html" title="">PROFETA EN SU TIERRA</a>
			</h3>

						<p class="font-size=11px">Con apenas 39 años –de los que pasó la última década casi postrada por el lupus–, Flannery O’Connor se convirtió en...</p>
									<ul>
								<li class="hlibros">
					<a href="/diario/suplementos/libros/10-4384-2011-08-29.html" title="">Profeta en su tierra</a>
				</li>
								<li class="hlibros">
					<a href="/diario/suplementos/libros/10-4385-2011-08-29.html" title="">Contar su vida</a>

				</li>
								<li class="hlibros">
					<a href="/diario/suplementos/libros/10-4386-2011-08-29.html" title="">La violencia vacía</a>
				</li>
								<li class="hlibros">
					<a href="/diario/suplementos/libros/10-4387-2011-08-29.html" title="">La madre de Mary Shelley y otras personas corrientes</a>
				</li>
								<li class="hlibros">

					<a href="/diario/suplementos/libros/10-4388-2011-08-29.html" title="">Nadie está tan fuera de la ley</a>
				</li>
								<li class="hlibros">
					<a href="/diario/suplementos/libros/10-4389-2011-08-29.html" title="">Probar de todo</a>
				</li>
								<li class="hlibros">
					<a href="/diario/suplementos/libros/10-4390-2011-08-29.html" title="">Leer para leer</a>

				</li>
								<li class="hlibros">
					<a href="/diario/suplementos/libros/10-4391-2011-08-29.html" title="">El futuro sin correcciones</a>
				</li>
							</ul>
			
		</div>
		<!----->
		
	
				<!----->

		<div class="suple">

			<p class="fecha">28-ago-2011</p>
			<h2 class="eturismo">Turismo</a></h2>
			<h3 class="hturismo">
				<a href="/diario/suplementos/turismo/index.html" title="">QATAR</a>
			</h3>
						<p class="font-size=11px">Viaje a Doha, la ultramoderna capital del país enclavado en el desierto de la Península Arábiga.</p>

									<ul>
								<li class="hturismo">
					<a href="/diario/suplementos/turismo/9-2140-2011-08-29.html" title="">Del zoco al mercado global</a>
				</li>
								<li class="hturismo">
					<a href="/diario/suplementos/turismo/9-2138-2011-08-29.html" title="">¡Pura vida tica!</a>
				</li>
								<li class="hturismo">

					<a href="/diario/suplementos/turismo/9-2141-2011-08-29.html" title="">Aprender a cuidar</a>
				</li>
								<li class="hturismo">
					<a href="/diario/suplementos/turismo/9-2142-2011-08-29.html" title="">Primavera azteca</a>
				</li>
								<li class="hturismo">
					<a href="/diario/suplementos/turismo/10-2139-2011-08-29.html" title="">Noticiero</a>

				</li>
							</ul>
			
		</div>
		<!----->
		
	
				<!----->
		<div class="suple">

			<p class="fecha">27-ago-2011</p>
			<h2 class="esatira">Satira12</a></h2>

			<h3 class="hsatira">
				<a href="/diario/suplementos/satira/index.html" title="">“Siga el baile, siga el baile”</a>
			</h3>
						<p class="font-size=11px">SUPLEMENTO DOS POR CUATRO > EL MUNDIAL DE TANGO</p>
									<ul>
								<li class="hsatira">
					<a href="/diario/suplementos/satira/0-225-2011-08-29.html" title="">Hoy Sátira Hoy</a>

				</li>
							</ul>
			
		</div>
		<!----->
		
	
				<!----->
		<div class="suple">

			<p class="fecha">27-ago-2011</p>
			<h2 class="em2">M2</a></h2>

			<h3 class="hm2">
				<a href="/diario/suplementos/m2/index.html" title="">folios</a>
			</h3>
						<p class="font-size=11px">Muggeri y Escobar explican cómo especializarse en gráfica para el arte</p>
									<ul>
								<li class="hm2">
					<a href="/diario/suplementos/m2/10-2129-2011-08-29.html" title="">De catálogo</a>

				</li>
								<li class="hm2">
					<a href="/diario/suplementos/m2/10-2130-2011-08-29.html" title="">Patrimonio sí, hamburguesas no</a>
				</li>
								<li class="hm2">
					<a href="/diario/suplementos/m2/10-2131-2011-08-29.html" title="">El CAAP desestima y quema los papeles</a>
				</li>
								<li class="hm2">

					<a href="/diario/suplementos/m2/10-2132-2011-08-29.html" title="">La Richmond, en Gran Bretaña</a>
				</li>
							</ul>
			
		</div>
		<!----->
		
	
				<!----->
		<div class="suple">

			<p class="fecha">27-ago-2011</p>

			<h2 class="efuturo">Futuro</a></h2>
			<h3 class="hfuturo">
				<a href="/diario/suplementos/futuro/index.html" title="">Cuando empezamos a caminar</a>
			</h3>
						<p class="font-size=11px">PALEOANTROPOLOGIA: LOS ORIGENES <br />
 DEL BIPEDISMO<br />
 Uno de los momentos estelares en la evolución humana es...</p>

									<ul>
								<li class="hfuturo">
					<a href="/diario/suplementos/futuro/13-2582-2011-08-29.html" title="">Cuando empezamos a caminar</a>
				</li>
								<li class="hfuturo">
					<a href="/diario/suplementos/futuro/13-2583-2011-08-29.html" title="">Yendo de la cama al Nobel</a>
				</li>
								<li class="hfuturo">

					<a href="/diario/suplementos/futuro/13-2584-2011-08-29.html" title="">Agenda científica</a>
				</li>
							</ul>
			
		</div>
		<!----->
		
	
				<!----->
		<div class="suple">

			<p class="fecha">26-ago-2011</p>

			<h2 class="esoy">Soy</a></h2>
			<h3 class="hsoy">
				<a href="/diario/suplementos/soy/index.html" title="">Femenino singular</a>
			</h3>
						<p class="font-size=11px">La nueva y más exitosa supermodelo del momento es un hombre. Se llama Andrej Pejic, tiene 19 años y también modela...</p>
									<ul>
								<li class="hsoy">

					<a href="/diario/suplementos/soy/1-2097-2011-08-29.html" title="">Quién es esa ¿chica?</a>
				</li>
								<li class="hsoy">
					<a href="/diario/suplementos/soy/1-2098-2011-08-29.html" title="">Tres deseos para la liberación masculina</a>
				</li>
								<li class="hsoy">
					<a href="/diario/suplementos/soy/1-2099-2011-08-29.html" title="">El hombre de al lado</a>

				</li>
								<li class="hsoy">
					<a href="/diario/suplementos/soy/1-2100-2011-08-29.html" title="">Sobre llovido besado</a>
				</li>
								<li class="hsoy">
					<a href="/diario/suplementos/soy/1-2101-2011-08-29.html" title="">Haciendo memoria</a>
				</li>
								<li class="hsoy">

					<a href="/diario/suplementos/soy/1-2102-2011-08-29.html" title="">Canción para mi muerte</a>
				</li>
								<li class="hsoy">
					<a href="/diario/suplementos/soy/1-2103-2011-08-29.html" title="">Un día para recordar</a>
				</li>
								<li class="hsoy">
					<a href="/diario/suplementos/soy/1-2104-2011-08-29.html" title="">Decir lesbiana, gritar tortillera</a>

				</li>
								<li class="hsoy">
					<a href="/diario/suplementos/soy/1-2105-2011-08-29.html" title="">Marco familiar</a>
				</li>
							</ul>
			
		</div>
		<!----->
		
	
				<!----->

		<div class="suple">

			<p class="fecha">26-ago-2011</p>
			<h2 class="elas12">Las12</a></h2>
			<h3 class="hlas12">
				<a href="/diario/suplementos/las12/index.html" title="">ELLAS X ELLAS</a>
			</h3>
						<p class="font-size=11px">LA NUEVA EDICION DE LA MUJER Y EL CINE APORTA MIRADAS DIVERSAS DESDE IBEROAMERICA E INCLUYE OPERAS PRIMAS DE JOVENES...</p>

									<ul>
								<li class="hlas12">
					<a href="/diario/suplementos/las12/13-6707-2011-08-29.html" title="">MUJERERIO</a>
				</li>
								<li class="hlas12">
					<a href="/diario/suplementos/las12/13-6708-2011-08-29.html" title="">Hecha la ley, sigue la trata </a>
				</li>
								<li class="hlas12">

					<a href="/diario/suplementos/las12/13-6709-2011-08-29.html" title="">Profundizar los derechos sexuales</a>
				</li>
								<li class="hlas12">
					<a href="/diario/suplementos/las12/13-6710-2011-08-29.html" title="">Hay organizaciones de padres que albergan a abusadores y/o violentos</a>
				</li>
								<li class="hlas12">
					<a href="/diario/suplementos/las12/13-6711-2011-08-29.html" title="">Ni musa ni groupie: Rockera de profesion </a>

				</li>
								<li class="hlas12">
					<a href="/diario/suplementos/las12/13-6712-2011-08-29.html" title="">La colección Escuela, de Pablo Ramírez</a>
				</li>
								<li class="hlas12">
					<a href="/diario/suplementos/las12/13-6713-2011-08-29.html" title="">Milonga Andariega</a>
				</li>
								<li class="hlas12">

					<a href="/diario/suplementos/las12/13-6714-2011-08-29.html" title="">El lobo del hombre </a>
				</li>
								<li class="hlas12">
					<a href="/diario/suplementos/las12/13-6715-2011-08-29.html" title="">Las muchachas de antes</a>
				</li>
								<li class="hlas12">
					<a href="/diario/suplementos/las12/13-6716-2011-08-29.html" title="">@ o la lengua del amor</a>

				</li>
								<li class="hlas12">
					<a href="/diario/suplementos/las12/13-6717-2011-08-29.html" title="">Perdedora</a>
				</li>
								<li class="hlas12">
					<a href="/diario/suplementos/las12/13-6718-2011-08-29.html" title="">Misiones: El mensaje para otras niñas que no se animan a denunciar</a>
				</li>
								<li class="hlas12">

					<a href="/diario/suplementos/las12/13-6719-2011-08-29.html" title="">La relación colonial</a>
				</li>
							</ul>
			
		</div>
		<!----->
		
	
				<!----->
		<div class="suple">

			<p class="fecha">25-ago-2011</p>

			<h2 class="eno">NO</a></h2>
			<h3 class="hno">
				<a href="/diario/suplementos/no/index.html" title="">Larga vida</a>
			</h3>
						<p class="font-size=11px">Se cumplen 25 años de la salida del emblemático disco The Queen is Dead, de The Smiths. Lo recuerdan y lo recomiendan...</p>
									<ul>
								<li class="hno">

					<a href="/diario/suplementos/no/12-5586-2011-08-29.html" title="">Morrissey, Morrissey, Morrissey... Morrissey te vinimos a ver</a>
				</li>
								<li class="hno">
					<a href="/diario/suplementos/no/12-5587-2011-08-29.html" title="">“No podemos pedir que se vayan todos”</a>
				</li>
								<li class="hno">
					<a href="/diario/suplementos/no/12-5588-2011-08-29.html" title="">“Ya no podés ir tan a pérdida”</a>

				</li>
								<li class="hno">
					<a href="/diario/suplementos/no/12-5589-2011-08-29.html" title="">Todo suma </a>
				</li>
								<li class="hno">
					<a href="/diario/suplementos/no/12-5590-2011-08-29.html" title="">Cuchara o muerte, venceremos</a>
				</li>
								<li class="hno">

					<a href="/diario/suplementos/no/12-5591-2011-08-29.html" title="">Agenda</a>
				</li>
								<li class="hno">
					<a href="/diario/suplementos/no/12-5592-2011-08-29.html" title="">Hashtags</a>
				</li>
								<li class="hno">
					<a href="/diario/suplementos/no/34-5593-2011-08-29.html" title="">Hoy: una aventura de Sandra Russa</a>

				</li>
							</ul>
			
		</div>
		<!----->
		
	
</div>



				
		
						
		
			
		
		
		<div><script language="JavaScript" src="http://ads.pagina12.com.ar/banner.php?s=116&w=232&h=0&t=_blank&cla=bannerp12"></script></div>
		<div><script language="JavaScript" src="http://ads.pagina12.com.ar/banner.php?s=117&w=232&h=0&t=_blank&cla=bannerp12"></script></div>

		
						
	</div>
		
		<div class="columna232 left12">

				

		

<div class="top12">
	    
		
	
</div>

		
		<div id="notaspag12" class="top12">

			
			<div id="clippings_top">
				<div id="clippings_user"></div>

				<div id="clippings_toc"></div>
				<div id="clippings_total"></div>
			</div>
			

			
			<div id="clippings_container" style="display:none">
				<div id="clippings_folder"></div>
				<div id="clippings_controls"><span id="del_selected"></span><span id="del_all"></span><span id="clip_help"></span></div>	
			</div>
			

		</div>
		
				
		
						
		<div><script language="JavaScript" src="http://ads.pagina12.com.ar/banner.php?s=122&w=232&h=0&t=_blank&cla=bannerp12"></script></div>

		
				
		 		
				
 		<div class="top12 center border" id="tapa_dia">
	 		<a href="/diario/principal/diario/index.html" title="Tapa del d&iacute;a">
						<img src="http://www.pagina12.com.ar/fotos/thumb/230/20110829/diario/tapagn.jpg" alt="Tapa en papel"/>
						</a>
 		</div>
		<p class="volanta right">TAPA DEL DIA</p>
		 		
					
						<div id="bloque_escriben_hoy">
				<h4>ESCRIBEN HOY</h4>

				<ul>
										<li><a href="/diario/elmundo/4-175583-2011-08-29.html" title=""><span style="color:#028ccd">Adrián Pérez</span></a>&nbsp;</li>
										<li><a href="/diario/elpais/1-175595-2011-08-29.html" title=""><span style="color:#8e8a7b">Alejandra Dandan</span></a>&nbsp;</li>
										<li><a href="/diario/elmundo/4-175589-2011-08-29.html" title=""><span style="color:#504f4f">Carlos Noriega</span></a>&nbsp;</li>
										<li><a href="/diario/elpais/1-175594-2011-08-29.html" title=""><span style="color:#028ccd">Eduardo Aliverti</span></a>&nbsp;</li>
										<li><a href="/diario/suplementos/rosario/12-30197-2011-08-29.html" title=""><span style="color:#8e8a7b">Emilio A. Bellon</span></a>&nbsp;</li>

										<li><a href="/diario/elmundo/subnotas/175586-55414-2011-08-29.html" title=""><span style="color:#504f4f">Ernesto Semán</span></a>&nbsp;</li>
										<li><a href="/diario/suplementos/espectaculos/17-22731-2011-08-29.html" title=""><span style="color:#028ccd">Facundo García</span></a>&nbsp;</li>
										<li><a href="/diario/suplementos/libero/10-6223-2011-08-29.html" title=""><span style="color:#8e8a7b">Facundo Martínez</span></a>&nbsp;</li>
										<li><a href="/diario/economia/2-175569-2011-08-29.html" title=""><span style="color:#504f4f">Fernando Krakowiak</span></a>&nbsp;</li>
										<li><a href="/diario/elmundo/4-175584-2011-08-29.html" title=""><span style="color:#028ccd">Fernando Peirone</span></a>&nbsp;</li>
										<li><a href="/diario/suplementos/rosario/14-30195-2011-08-29.html" title=""><span style="color:#8e8a7b">Guillermo Paniaga</span></a>&nbsp;</li>

										<li><a href="/diario/elmundo/subnotas/175587-55412-2011-08-29.html" title=""><span style="color:#504f4f">Ignacio Kostzer</span></a>&nbsp;</li>
										<li><a href="/diario/economia/2-175563-2011-08-29.html" title=""><span style="color:#028ccd">Javier Lewkowicz</span></a>&nbsp;</li>
										<li><a href="/diario/suplementos/espectaculos/3-22733-2011-08-29.html" title=""><span style="color:#8e8a7b">Juan Ignacio Provéndola</span></a>&nbsp;</li>
										<li><a href="/diario/suplementos/libero/subnotas/6223-3255-2011-08-29.html" title=""><span style="color:#504f4f">Juan José Panno</span></a>&nbsp;</li>
										<li><a href="/diario/contratapa/13-175591-2011-08-29.html" title=""><span style="color:#028ccd">Juan Sasturain</span></a>&nbsp;</li>
										<li><a href="/diario/autores/julian_bruschtein/index-2011-08-29.html" title=""><span style="color:#8e8a7b">Julián Bruschtein</span></a>&nbsp;</li>

										<li><a href="/diario/suplementos/rosario/12-30196-2011-08-29.html" title=""><span style="color:#504f4f">Leandro Arteaga</span></a>&nbsp;</li>
										<li><a href="/diario/suplementos/rosario/22-30200-2011-08-29.html" title=""><span style="color:#028ccd">Leo Ricciardino</span></a>&nbsp;</li>
										<li><a href="/diario/suplementos/rosario/10-30201-2011-08-29.html" title=""><span style="color:#8e8a7b">Lorena Panzerini</span></a>&nbsp;</li>
										<li><a href="/diario/suplementos/espectaculos/3-22732-2011-08-29.html" title=""><span style="color:#504f4f">Luis Paz</span></a>&nbsp;</li>
										<li><a href="/diario/elpais/1-175600-2011-08-29.html" title=""><span style="color:#028ccd">Mario Wainfeld</span></a>&nbsp;</li>
										<li><a href="/diario/elpais/1-175568-2011-08-29.html" title=""><span style="color:#8e8a7b">Mario de Casas</span></a>&nbsp;</li>

										<li><a href="/diario/elpais/1-175567-2011-08-29.html" title=""><span style="color:#504f4f">Miguel Jorquera</span></a>&nbsp;</li>
										<li><a href="/diario/elpais/1-175585-2011-08-29.html" title=""><span style="color:#028ccd">Nicolás Lantos</span></a>&nbsp;</li>
										<li><a href="/diario/sociedad/3-175573-2011-08-29.html" title=""><span style="color:#8e8a7b">Pedro Lipcovich</span></a>&nbsp;</li>
										<li><a href="/diario/elpais/subnotas/175567-55411-2011-08-29.html" title=""><span style="color:#504f4f">Sebastian Abrevaya</span></a>&nbsp;</li>
										<li><a href="/diario/suplementos/libero/11-6219-2011-08-29.html" title=""><span style="color:#028ccd">Sebastián Fest</span></a>&nbsp;</li>
										<li><a href="/diario/suplementos/espectaculos/4-22737-2011-08-29.html" title=""><span style="color:#8e8a7b">Silvina Friera</span></a>&nbsp;</li>

										<li><a href="/diario/suplementos/rosario/9-30205-2011-08-29.html" title=""><span style="color:#504f4f">Sonia Tessa</span></a>&nbsp;</li>
										<li><a href="/diario/autores/veronica_gago/index-2011-08-29.html" title=""><span style="color:#028ccd">Veronica Gago</span></a>&nbsp;</li>
									</ul>
			</div>
					
	</div>
	
		
	<div id="pie">

		<div id="menu_pie">

		<ul>
			<li><a href="/diario/ultimas/index.html" title="">Ultimas noticias</a></li>
			<li><a href="/diario/principal/index.html" title="">Edicion impresa</a></li>
			<li><a href="/diario/suplementos/index.html" title="">Suplementos</a></li>
			
			<li><a href="/buscador/index.php" title="">Busqueda</a></li>
			<li><a href="/usuarios/publicidad.php" title="">Publicidad</a></li>

			<li><a href="/usuarios/institucional.php" title="">Institucional</a></li>
			<li><a href="/usuarios/correo.php" title="">Correo</a></li>
			<li><a href="/usuarios/rss.php" title=""><img src="/commons/imgs/rss-icon.gif" alt="RSS" style="position:relative;top:2px"/>&nbsp;RSS</a></li>
		</ul>
		</div>

		<div id="logo_pie">
			<p><img src="/commons/imgs/logopie.gif" alt="Pagina/12 - hosted by IFX"/></p>

			<p><img src="/commons/imgs/cellphone.gif" alt="Movil"/><strong>Desde su m&oacute;vil acceda a trav&eacute;s de <span class="cprincipal">http://m.pagina12.com.ar</span></strong></p>
			<p>&copy; 2000-2011 www.pagina12.com.ar | Rep&uacute;blica Argentina | <a href="/usuarios/politica_privacidad.php" title="Pol&iacute;tica de privacidad">Pol&iacute;tica de privacidad</a> | Todos los Derechos Reservados</p>
			<p>Sitio desarrollado con software libre <a href="http://es.wikipedia.org/wiki/GNU/Linux" title="Sistema operativo GNU/Linux">GNU/Linux</a>.</p>

		</div>

	</div>

	<div class="clear"></div>

	
		<script type="text/javascript">
	var gaJsHost = (("https:" == document.location.protocol) ? "https://ssl." : "http://www.");
	document.write(unescape("%3Cscript src='" + gaJsHost + "google-analytics.com/ga.js' type='text/javascript'%3E%3C/script%3E"));
	</script>
	<script type="text/javascript">
	var pageTracker = _gat._getTracker("UA-5077596-1");
	pageTracker._initData();
	pageTracker._trackPageview();
	</script>
		

</div>

</body>
</html>


I'm using NOTEPAD++ for both editing the recipe file, and analizing the HTML code.
macpablus is offline   Reply With Quote
Old 08-30-2011, 09:15 AM   #4
Starson17
Wizard
Starson17 can program the VCR without an owner's manual.Starson17 can program the VCR without an owner's manual.Starson17 can program the VCR without an owner's manual.Starson17 can program the VCR without an owner's manual.Starson17 can program the VCR without an owner's manual.Starson17 can program the VCR without an owner's manual.Starson17 can program the VCR without an owner's manual.Starson17 can program the VCR without an owner's manual.Starson17 can program the VCR without an owner's manual.Starson17 can program the VCR without an owner's manual.Starson17 can program the VCR without an owner's manual.
 
Posts: 4,004
Karma: 177841
Join Date: Dec 2009
Device: WinMo: IPAQ; Android: HTC HD2, Archos 7o; Java:Gravity T
Quote:
Originally Posted by macpablus View Post
Thanks Starson!
As far as I can tell, the recipe is crashing while parsing your index page. It gets to the line:
Code:
 for section in soup.findAll('div', attrs={'class':'seccionx'}):
with the soup, then crashes. It looks like BeautifulSoup can't parse the soup. I'd suspect some malformed HTML on that page that BS can't handle. Try reading the BS info page (there's links in the sticky). I vaguely recall some discussion there on problems like this, or strip out as much of the page as possible before it gets to that line.
Starson17 is offline   Reply With Quote
Old 08-30-2011, 11:28 PM   #5
macpablus
Enthusiast
macpablus once ate a cherry pie in a record 7 seconds.macpablus once ate a cherry pie in a record 7 seconds.macpablus once ate a cherry pie in a record 7 seconds.macpablus once ate a cherry pie in a record 7 seconds.macpablus once ate a cherry pie in a record 7 seconds.macpablus once ate a cherry pie in a record 7 seconds.macpablus once ate a cherry pie in a record 7 seconds.macpablus once ate a cherry pie in a record 7 seconds.macpablus once ate a cherry pie in a record 7 seconds.macpablus once ate a cherry pie in a record 7 seconds.macpablus once ate a cherry pie in a record 7 seconds.
 
Posts: 25
Karma: 1896
Join Date: Aug 2011
Device: Kindle 3
Quote:
Originally Posted by Starson17 View Post
As far as I can tell, the recipe is crashing while parsing your index page.
Hey, that's cheating! ;-) Too much for my first attempt to write a recipe.

But, I was "smelling" something strange, 'cause with another attempt with the mobile version of the page (http://m.pagina12.com.ar/diario/ultimas/), I was able to find sections.

I think I'm gonna copy the file to my local disc, and trim the beginning of the page to see if that works, and maybe identify the problem. Thanks for the tips!
macpablus is offline   Reply With Quote
Advert
Old 08-31-2011, 01:35 AM   #6
macpablus
Enthusiast
macpablus once ate a cherry pie in a record 7 seconds.macpablus once ate a cherry pie in a record 7 seconds.macpablus once ate a cherry pie in a record 7 seconds.macpablus once ate a cherry pie in a record 7 seconds.macpablus once ate a cherry pie in a record 7 seconds.macpablus once ate a cherry pie in a record 7 seconds.macpablus once ate a cherry pie in a record 7 seconds.macpablus once ate a cherry pie in a record 7 seconds.macpablus once ate a cherry pie in a record 7 seconds.macpablus once ate a cherry pie in a record 7 seconds.macpablus once ate a cherry pie in a record 7 seconds.
 
Posts: 25
Karma: 1896
Join Date: Aug 2011
Device: Kindle 3
EUREKA!!! (sort of...).

These seems to be the problem...

Code:
<!DOCTYPE html 
	PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN
	"http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
...as I removed it, and was able to find sections. ;-)
macpablus is offline   Reply With Quote
Old 08-31-2011, 02:57 PM   #7
Starson17
Wizard
Starson17 can program the VCR without an owner's manual.Starson17 can program the VCR without an owner's manual.Starson17 can program the VCR without an owner's manual.Starson17 can program the VCR without an owner's manual.Starson17 can program the VCR without an owner's manual.Starson17 can program the VCR without an owner's manual.Starson17 can program the VCR without an owner's manual.Starson17 can program the VCR without an owner's manual.Starson17 can program the VCR without an owner's manual.Starson17 can program the VCR without an owner's manual.Starson17 can program the VCR without an owner's manual.
 
Posts: 4,004
Karma: 177841
Join Date: Dec 2009
Device: WinMo: IPAQ; Android: HTC HD2, Archos 7o; Java:Gravity T
Quote:
Originally Posted by macpablus View Post
EUREKA!!! (sort of...).

These seems to be the problem...

Code:
<!DOCTYPE html 
	PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN
	"http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
...as I removed it, and was able to find sections. ;-)
Excellent! I hate it when I'm trying to figure out what I'm doing wrong and find out it's not me.
Starson17 is offline   Reply With Quote
Old 09-01-2011, 12:42 AM   #8
macpablus
Enthusiast
macpablus once ate a cherry pie in a record 7 seconds.macpablus once ate a cherry pie in a record 7 seconds.macpablus once ate a cherry pie in a record 7 seconds.macpablus once ate a cherry pie in a record 7 seconds.macpablus once ate a cherry pie in a record 7 seconds.macpablus once ate a cherry pie in a record 7 seconds.macpablus once ate a cherry pie in a record 7 seconds.macpablus once ate a cherry pie in a record 7 seconds.macpablus once ate a cherry pie in a record 7 seconds.macpablus once ate a cherry pie in a record 7 seconds.macpablus once ate a cherry pie in a record 7 seconds.
 
Posts: 25
Karma: 1896
Join Date: Aug 2011
Device: Kindle 3
Now that I found the problem, it would be nice to find a solution also, right? ;-)

The one I'm using (downloading the index.file and manually removing the offending DOCTYPE declaration), is a bit.... boring.

So I've tried this...

Quote:
preprocess_regexps = [
(re.compile(r'<!DOCTYPE html .*strict.dtd">', re.DOTALL|re.IGNORECASE),
lambda match: '<!DOCTYPE html>'),
]
...but nothing happens.
macpablus is offline   Reply With Quote
Reply


Forum Jump

Similar Threads
Thread Thread Starter Forum Replies Last Post
Recipe request of Frontlineonnet.com(no rss) sexymax15 Recipes 3 06-24-2011 10:40 AM
Create recipe where site has no RSS? jck99nz Recipes 3 06-16-2011 01:24 PM
Recipe for a RSS with a Hodgepodge of Sources? spedinfargo Recipes 1 03-01-2011 09:28 AM
Finding the XML in Site RSS jessie102 Workshop 1 08-19-2008 10:54 AM
Top RSS humor site feeds Bob Russell Lounge 1 02-05-2006 08:01 AM


All times are GMT -4. The time now is 06:05 AM.


MobileRead.com is a privately owned, operated and funded community.