Register Guidelines E-Books Today's Posts Search

Go Back   MobileRead Forums > E-Book Software > Calibre > Plugins

Notices

Reply
 
Thread Tools Search this Thread
Old 10-13-2023, 06:37 AM   #16
lrpirlet
Connoisseur
lrpirlet began at the beginning.
 
Posts: 93
Karma: 40
Join Date: Mar 2020
Location: Belgium (sorry, I am from the Walloon side of the country and I speak french only)
Device: PW3, Kobo Libra H2O
probablement possible

Quote:
Originally Posted by Djazzy View Post
bonjour, je voulais savoir si il était possible de récupérer seulement les étiquettes les plus importantes sur Babelio.
En effet chaque livre à plusieurs étiquettes certaines sont écrites en plus gros et donc je voudrais que sur calibre seul ces étiquettes écrite en gros soit prise en compte, car sinon il met 10 - 15 étiquettes ^^ je pourrait limiter le nombres à 1 ou 2 en effet mais je ne suis pas sur qu'il prendrait l'étiquette qui m’intéresse.

j'ai mis une image pour illustrer ce que je voudrait qu'il prenne (en bleue)
Réponse rapide: pour qu'un texte html soit formaté avec une police plus grande il faut une instruction. EN THEORIE, on peut repérer cette instruction et sélectionner celles qui sont plus grandes.... en pratique j'ignore si ces instructions sont cohérentes d'un livre à l'autre, et je n'ai pas beaucoup de temps pour examiner un sample suffisant sans me faire bannir de babelio.com.

Réponse définitive: peut-etre un jour
lrpirlet is offline   Reply With Quote
Old 10-13-2023, 06:52 AM   #17
lrpirlet
Connoisseur
lrpirlet began at the beginning.
 
Posts: 93
Karma: 40
Join Date: Mar 2020
Location: Belgium (sorry, I am from the Walloon side of the country and I speak french only)
Device: PW3, Kobo Libra H2O
Probable change in the babelio.com interface

Quote:
Originally Posted by Djazzy View Post
hello,

This no longer works correctly. all searches lead to errors. It worked well during the day and suddenly it didn't work anymore .

In fact, it only works if I put the "babelio_id:"
but that means having to look up the ID on the site for each book....
whereas before just with the right title without the id it worked very well

Code:
Running identify query with parameters: 
{'title': 'Paper money', 'authors': ['Ken Follett'], 'identifiers': {'isbn': '9782253160120'}, 'timeout': 30} 
Using plugins: Babelio_db (0, 8, 3) 
The log from individual plugins is below 

****************************** Babelio_db (0, 8, 3) ****************************** 
Found 0 results 
Downloading from Babelio_db took 21.920482397079468 
-+-+-+-+-+-+-+-+-+-+ Entry point +-+-+-+-+-+-+-+-+-+-
self.dgb_lvl              :  3
self.with_cover           :  True
self.with_pretty_comments :  True
self.with_detailed_rating :  True

In identify(self, log, result_queue, abort, title=.., authors=.., identifiers=.., timeout=30)

title             :  Paper money
identifiers       :  {'isbn': '9782253160120'}
authors           :  ['Ken Follett'] <class 'list'>
ISBN identifier trouvé, on cherche cet ISBN sur babelio :  https://www.babelio.com/resrecherche.php?Recherche=9782253160120&item_recherche=isbn
 Accessing url     :  https://www.babelio.com/resrecherche.php?Recherche=9782253160120&item_recherche=isbn
 (urlopen_with_retry) HTTP Error 404: Not Found , will retry in 3 seconds...
 (urlopen_with_retry) HTTP Error 404: Not Found , will retry in 6 seconds...
 (urlopen_with_retry) HTTP Error 404: Not Found , will retry in 12 seconds...
 exception occured...
 code :  404 reason :  Not Found
Plugin Babelio_db failed
Traceback (most recent call last):
  File "calibre_plugins.babelio_db.__init__", line 81, in urlopen_with_retry
  File "mechanize\_mechanize.py", line 257, in open
  File "mechanize\_mechanize.py", line 313, in _mech_open
mechanize._response.get_seek_wrapper_class.<locals>.httperror_seek_wrapper: HTTP Error 404: Not Found

During handling of the above exception, another exception occurred:

Traceback (most recent call last):
  File "calibre\ebooks\metadata\sources\identify.py", line 47, in run
  File "calibre_plugins.babelio_db.__init__", line 393, in identify
  File "calibre_plugins.babelio_db.__init__", line 60, in __call__
  File "calibre_plugins.babelio_db.__init__", line 127, in ret_soup
  File "calibre_plugins.babelio_db.__init__", line 99, in urlopen_with_retry
Exception: ('(urlopen_with_retry) Failed while acessing url : ', 'https://www.babelio.com/resrecherche.php?Recherche=9782253160120&item_recherche=isbn') 

******************************************************************************** 
The identify phase took 22.09 seconds 
The longest time (21.920482) was taken by: Babelio_db 
Merging results from different sources 
We have 0 merged results, merging took: 0.00 seconds
Hum, this looks like a change in the Babelio.com interface... I'll have a look as soon as I find some time.
lrpirlet is offline   Reply With Quote
Advert
Old 10-13-2023, 01:13 PM   #18
Djazzy
Member
Djazzy began at the beginning.
 
Posts: 12
Karma: 10
Join Date: Oct 2023
Device: Kobo Libra 2
Quote:
Originally Posted by lrpirlet View Post
Hum, this looks like a change in the Babelio.com interface... I'll have a look as soon as I find some time.
D'accord, et je note aussi pour les étiquettes

Pour le problème avec l'ID je me demandais si c'était que chez moi que cela ne fonctionnait plus mais si je comprend bien c'est du à un changement sur le site, donc me voila rassuré et bonne chance pour les futurs réglages. ça ne presse pas du tout, la vie IRL avant tout
Djazzy is offline   Reply With Quote
Old 10-14-2023, 04:56 PM   #19
lrpirlet
Connoisseur
lrpirlet began at the beginning.
 
Posts: 93
Karma: 40
Join Date: Mar 2020
Location: Belgium (sorry, I am from the Walloon side of the country and I speak french only)
Device: PW3, Kobo Libra H2O
Quote:
Originally Posted by Djazzy View Post
D'accord, et je note aussi pour les étiquettes
OK J'ai modifié babelio_db pour prendre en considération les modifications apportée a babelio.com.

Mais je n'ai pas testé beaucoup... Ca devrait marcher, ça marche pour les 4-5 livres que j'ai testés.

SVP rapporte les problèmes vus, si possible avec un log après avoir configuré babelio_db et avoir mis la verbosité du journal a 15.

Voir ici

Au passage, j'ai regardé les etiquettes: il semble y avoir 5 couleurs et 13 dimensions de fontes...
As-tu une idée a quoi correspond les couleurs, il me semble voir un style (roman, theatre, nouvelle), un genre (littérature, science fiction, fantastique), une origine (Français), une époque (20me siècle)...

Code:
.tag_t14 {
    font-size: .7rem
}

.tag_t15 {
    font-size: .75rem
}

.tag_t16 {
    font-size: .8rem
}

.tag_t17 {
    font-size: .85rem
}

.tag_t18 {
    font-size: .9rem
}

.tag_t19 {
    font-size: .92rem
}

.tag_t20 {
    font-size: .95rem
}

.tag_t21 {
    font-size: 1rem
}

.tag_t22 {
    font-size: 1.1rem
}

.tag_t23 {
    font-size: 1.15rem
}

.tag_t24 {
    font-size: 1.2rem
}

.tag_t25 {
    font-size: 1.25rem
}

.tag_t26 {
    font-size: 1.3rem
}

.tc_0 {
    color: #900
}

.tc_1 {
    color: #c08f47
}

.tc_2 {
    color: #ff9d38
}

.tc_3 {
    color: #CB7
}
Voir ici
lrpirlet is offline   Reply With Quote
Old 10-14-2023, 06:23 PM   #20
Djazzy
Member
Djazzy began at the beginning.
 
Posts: 12
Karma: 10
Join Date: Oct 2023
Device: Kobo Libra 2
Quote:
Originally Posted by lrpirlet View Post

Au passage, j'ai regardé les etiquettes: il semble y avoir 5 couleurs et 13 dimensions de fontes...
As-tu une idée a quoi correspond les couleurs, il me semble voir un style (roman, theatre, nouvelle), un genre (littérature, science fiction, fantastique), une origine (Français), une époque (20me siècle)...
Bonjour,

merci pour le travail je vais essayer tout ça et ferait des retours au moindre problème

pour les étiquettes j'ai trouvé ça :

"
en allant voir sur cette page :

http://www.babelio.com/decouvriretiquettes.php

on se rend compte qu'il existe des étiquettes de différentes couleurs :

- rouge foncé : genre, type, catégorie de littérature
- beige clair : thèmes
- orange : origine géographique, pays...
- vert lichen : siècle, époque... "
Djazzy is offline   Reply With Quote
Advert
Old 10-14-2023, 06:48 PM   #21
Djazzy
Member
Djazzy began at the beginning.
 
Posts: 12
Karma: 10
Join Date: Oct 2023
Device: Kobo Libra 2
Tout fonctionne très bien, merci beaucoup ! je manquerai pas de rapporter les bugs divers s'il y en a, avec un log et la verbosité du journal a 15. Encore merci pour tout car je sais que c'est du boulot tout ça !
Djazzy is offline   Reply With Quote
Old 10-18-2023, 10:50 AM   #22
lrpirlet
Connoisseur
lrpirlet began at the beginning.
 
Posts: 93
Karma: 40
Join Date: Mar 2020
Location: Belgium (sorry, I am from the Walloon side of the country and I speak french only)
Device: PW3, Kobo Libra H2O
Quote:
Originally Posted by Djazzy View Post
bonjour, je voulais savoir si il était possible de récupérer seulement les étiquettes les plus importantes sur Babelio.
En effet chaque livre à plusieurs étiquettes certaines sont écrites en plus gros et donc je voudrais que sur calibre seul ces étiquettes écrite en gros soit prise en compte, car sinon il met 10 - 15 étiquettes ^^ je pourrait limiter le nombres à 1 ou 2 en effet mais je ne suis pas sur qu'il prendrait l'étiquette qui m’intéresse.

j'ai mis une image pour illustrer ce que je voudrait qu'il prenne (en bleue)
Essaye la version v0.8.5. Elle a besoin de test mais semble répondre a ce que tu demandes. Ouvre le zip, lis la doc dans le directory doc.

Je pense que tu devrais effacer toutes les etiquettes, puis essayer avec 1 dans la catégorie que tu vises et 0 dans les autres avant d'augmenter... Attention, mettre 1 te donnera toutes les etiquettes du plus haut niveau (celles dont la taille de fonte est la plus grande) donc pas nécessairement 1 etiquette...

Rapportes si tu rencontre un problème. Je ferai une nouvelle version quand ça marche bien.
lrpirlet is offline   Reply With Quote
Old 10-19-2023, 07:23 AM   #23
Djazzy
Member
Djazzy began at the beginning.
 
Posts: 12
Karma: 10
Join Date: Oct 2023
Device: Kobo Libra 2
Quote:
Originally Posted by lrpirlet View Post
Essaye la version v0.8.5. Elle a besoin de test mais semble répondre a ce que tu demandes. Ouvre le zip, lis la doc dans le directory doc.

Je pense que tu devrais effacer toutes les etiquettes, puis essayer avec 1 dans la catégorie que tu vises et 0 dans les autres avant d'augmenter... Attention, mettre 1 te donnera toutes les etiquettes du plus haut niveau (celles dont la taille de fonte est la plus grande) donc pas nécessairement 1 etiquette...

Rapportes si tu rencontre un problème. Je ferai une nouvelle version quand ça marche bien.
C'est incroyable tu es trop fort j'ai fais quelques test progressivement, du coup ce qui me convient le plus c'est de mettre 2 voir 3 sur les étiquettes thématique et le genre, puis 0 sur les autres. Enfin tout dépendra du livre aussi.

Vraiment merci beaucoup, le tri des livres par genre devient nettement plus pertinent maintenant, c'est exactement ce que je voulais. Je ne sais pas comment te remercier, je ne manquerai pas de crier ton nom partout où je vais, "Merci à Louis Richard !" en commençant avec mon petit dons mensuel pour Calibre.
Djazzy is offline   Reply With Quote
Old 10-20-2023, 03:21 AM   #24
lrpirlet
Connoisseur
lrpirlet began at the beginning.
 
Posts: 93
Karma: 40
Join Date: Mar 2020
Location: Belgium (sorry, I am from the Walloon side of the country and I speak french only)
Device: PW3, Kobo Libra H2O
Quote:
Originally Posted by Djazzy View Post
"Merci à Louis Richard !" en commençant avec mon petit dons mensuel
thanks
lrpirlet is offline   Reply With Quote
Old 10-26-2023, 09:42 AM   #25
capichou
Junior Member
capichou began at the beginning.
 
Posts: 5
Karma: 10
Join Date: Oct 2023
Device: Kobo Libra H2O
Quote:
Originally Posted by lrpirlet View Post
SVP rapporte les problèmes vus, si possible avec un log après avoir configuré babelio_db et avoir mis la verbosité du journal a 15.
Hello,

Je viens de faire la mise à jour... Ça a fonctionné pour quelques livres, mais ça me renvoie maintenant des résultats aberrants. Voici un log avec verbosité à 15 comme demandé :
Spoiler:


Running identify query with parameters:
{'title': 'Janua Vera', 'authors': ['Jean-Philippe Jaworski'], 'identifiers': {}, 'timeout': 30}
Using plugins: Babelio_db (0, 8, 5)
The log from individual plugins is below

****************************** Babelio_db (0, 8, 5) ******************************
Found 1 results
Downloading from Babelio_db took 3.093478202819824


---
Title : Le Café sans nom
Author(s) : Robert Seethaler
Publisher : Sabine Wespieser
Tags : Roman Étranger, Littérature Générale, Rentrée Littéraire 2023, Roman, Amitié, Quartier Populaire, Littérature, Café, Littérature Allemande, Vienne, Littérature Autrichienne, Après-Guerre
Languages : fr
Rating : 2
Published : 2023-01-06T22:00:00+00:00
Identifiers : isbn:9782848054926, babelio_id:Seethaler-Le-Cafe-sans-nom/1525266
Comments : b'<html>\n <body>\n <div>\n <p>\n Référence:\n <a href="https://www.babelio.com/livres/Seethaler-Le-Cafe-sans-nom/1525266">\n https://www.babelio.com/livres/Seeth...-nom/1525266\n </a>\n </p>\n </div>\n </body>\n</html>\n<html>\n <body>\n <div>\n <hr/>\n <p style="font-weight: bold; font-size: 18px">\n Popularité\n </p>\n <hr/>\n </div>\n </body>\n</html>\n<html>\n <body>\n <div>\n <p>\n Le nombre de cotations est\n <strong>\n 28\n </strong>\n , avec une note moyenne de\n <strong>\n 4.0\n </strong>\n sur 5\n </p>\n </div>\n </body>\n</html>\n<html>\n <body>\n <div>\n <hr/>\n <p style="font-weight: bold; font-size: 18px">\n Résumé\n </p>\n <hr/>\n </div>\n </body>\n</html>\n<html>\n <head>\n </head>\n <body>\n En cette année 1966, Robert Simon décide de prendre un nouveau départ, la trentaine venue. Employé journalier au marché des Carmélites, dans un faubourg populaire de Vienne, il réalise son vieux rêve et redonne vie au café laissé à l\'abandon devant lequel il passe chaque jour. C\'est avec sa coutumière attention aux détails que le grand écrivain Autrichien évoque les destinées modestes de ceux qui deviendront les habitués du Café sans nom.\n <br/>\n Depuis Le Tabac Tresniek (2014), Seethaler n\'avait plus mis en scène sa ville natale : ses descriptions de Vienne renaissant de ses cendres vingt ans après la fin de la Deuxième guerre mondiale ont ici une tendresse et une saveur particulières.\n <br/>\n </body>\n</html>'
-+-+-+-+-+-+-+-+-+-+ Entry point +-+-+-+-+-+-+-+-+-+-
self.dgb_lvl : 15
self.with_cover : True
self.with_pretty_comments : True
self.with_detailed_rating : True
self.tag_genre : 12
self.tag_theme : 12
self.tag_lieu : 12
self.tag_quand : 12

In identify(self, log, result_queue, abort, title=.., authors=.., identifiers=.., timeout=30)

title : Janua Vera
identifiers : {}
authors : ['Jean-Philippe Jaworski'] <class 'list'>
Pas de résultat avec babelio_id ou avec l'ISBN, on recherche les auteurs et le titre.

in create_query()

title : Janua Vera
authors : ['Jean-Philippe Jaworski']

In ret_clean_txt(self, log, text, who='')

text : Jean-Philippe Jaworski
cleaned text : jean philippe jaworski
return text from ret_clean_txt

In ret_clean_txt(self, log, text, who='')

text : Janua Vera
cleaned text : janua vera
return text from ret_clean_txt
return url from create_query : https://www.babelio.com/recherche
return rkt from create_query : {'Recherche': 'jean philippe jaworski janua vera'}
In ret_soup(log, dbg_lvl, br, url, rkt={'Recherche': 'jean philippe jaworski janua vera'}, who=)

URL request time : 15:39:02
br : <Browser (not visiting a URL)>
url : https://www.babelio.com/recherche
rkt : {'Recherche': 'jean philippe jaworski janua vera'}
Accessing url : https://www.babelio.com/recherche
search parameters : {'Recherche': 'jean philippe jaworski janua vera'}
formated parameters : Recherche=jean+philippe+jaworski+janua+vera
In urlopen_with_retry(log, dbg_lvl, br, url, rkt=b'Recherche=jean+philippe+jaworski+janua+vera' , who=)

(urlopen_with_retry) sr.getcode() : 200
url_vrai : https://www.babelio.com/recherche
sr.info() : Server: nginx
Date: Thu, 26 Oct 2023 13:39:01 GMT
Content-Type: text/html; charset=ISO-8859-1
Connection: close
Set-Cookie: p=BE; expires=Fri, 25-Oct-2024 13:39:01 GMT; Max-Age=31536000
Set-Cookie: disclaimer=1; expires=Fri, 25-Oct-2024 13:39:01 GMT; Max-Age=31536000
Cache-Control: no-cache
Expires: Thu, 26 Oct 2023 13:39:00 GMT
Vary: Accept-Encoding
X-Frame-Options: SAMEORIGIN
content-type: text/html; charset=iso-8859-1
content-language: fr-FR
cache-control: no-cache
pragma: no-cache
expires: -1
x-ua-compatible: IE=edge


In parse_search_results(self, log, orig_title, orig_authors, soup, br)
orig_title : Janua Vera
orig_authors : ['jean philippe jaworski']
display each item found
<div class="cr_meta">
<div class="livres_txt">
<a class="titre1" href="/livres/Seethaler-Le-Cafe-sans-nom/1525266">
Le Café sans nom
</a>
</div>
<div class="sgst_auteur_txt" style="font-size: .65rem;">
<a class="libelle" href="/auteur/Robert-Seethaler/329203">
Robert Seethaler
</a>
<br/>
4.06★

(148)
</div>
</div>


In ret_clean_txt(self, log, text, who='')

text : Le Café sans nom
cleaned text : le cafe sans nom
return text from ret_clean_txt

In ret_clean_txt(self, log, text, who='')

text : Janua Vera
cleaned text : janua vera
return text from ret_clean_txt

In ret_clean_txt(self, log, text, who='')

text : Robert Seethaler
cleaned text : robert seethaler
return text from ret_clean_txt

In ret_clean_txt(self, log, text, who='')

text : jean philippe jaworski
cleaned text : jean philippe jaworski
return text from ret_clean_txt
titre : Le Café sans nom, auteur : Robert Seethaler, sous_url : /livres/Seethaler-Le-Cafe-sans-nom/1525266
nombre de références trouvées dans babelio 1
nombre de matches : 1
matches at return time :
https://www.babelio.com/livres/Seeth...ns-nom/1525266
matches : ['https://www.babelio.com/livres/Seethaler-Le-Cafe-sans-nom/1525266']
[worker 0] entry time : Thu Oct 26 15:39:02 2023
[worker 0] self.url : https://www.babelio.com/livres/Seeth...ns-nom/1525266
[worker 0] self.relevance : 0
[worker 0] self.plugin : <calibre_plugins.babelio_db.Babelio object at 0x000001DAE861C550>
[worker 0] self.dbg_lvl : 15
[worker 0] self.timeout : 20
[worker 0] self.with_cover : True
[worker 0] self.with_pretty_comments : True
[worker 0] self.with_detailed_rating : True
[worker 0] self.tag_genre : 12
[worker 0] self.tag_theme : 12
[worker 0] self.tag_lieu : 12
[worker 0] self.tag_quand : 12
submit time : Thu Oct 26 15:39:02 2023

[worker 0] in run(self)

[worker 0] in get_details(self)
[worker 0] in get details(), start time : 1698327542.6075132
[worker 0] calling ret_soup(log, dbg_lvl, br, url, rkt=None, who='')
[worker 0] self.url : https://www.babelio.com/livres/Seeth...ns-nom/1525266
[worker 0] In ret_soup(log, dbg_lvl, br, url, rkt=None, who=[worker 0])

[worker 0] URL request time : 15:39:03
[worker 0] br : <Browser (not visiting a URL)>
[worker 0] url : https://www.babelio.com/livres/Seeth...ns-nom/1525266
[worker 0] rkt : None
[worker 0] Accessing url : https://www.babelio.com/livres/Seeth...ns-nom/1525266
[worker 0] In urlopen_with_retry(log, dbg_lvl, br, url, rkt=None, who=[worker 0])

[worker 0] (urlopen_with_retry) sr.getcode() : 200
[worker 0] url_vrai : https://www.babelio.com/livres/Seeth...ns-nom/1525266
[worker 0] sr.info() : Server: nginx
Date: Thu, 26 Oct 2023 13:39:03 GMT
Content-Type: text/html; charset=ISO-8859-1
Connection: close
Cache-Control: no-cache
Expires: Thu, 26 Oct 2023 13:39:02 GMT
Vary: Accept-Encoding
X-Frame-Options: SAMEORIGIN
content-type: text/html; charset=iso-8859-1
content-language: fr-FR
cache-control: no-cache
pragma: no-cache
expires: -1
x-ua-compatible: IE=edge


[worker 0] Temps après ret_soup()... : 1.4092881679534912

[worker 0] in parse_bbl_id
[worker 0] bbl_id : Seethaler-Le-Cafe-sans-nom/1525266
[worker 0] Temps après parse_bbl_id() ... : 1.4092881679534912

[worker 0] in parse_details(self, soup)
[worker 0] in parse_details(), new start : 1698327544.0168014

[worker 0] in parse_authors(self, soup)
[worker 0] return bbl_authors ['Robert Seethaler']
[worker 0] Temps après parse_authors() ... : 0.0025281906127929688

[worker 0] in parse_title_series(self, soup, bbl_authors)
[worker 0] bbl_title : Le Café sans nom - Robert Seethaler
[worker 0] name : Robert Seethaler
[worker 0] bbl_title : Le Café sans nom
[worker 0] Temps après parse_title_series() ... : 0.010026693344116211

[worker 0] in parse_meta(self, soup)
[worker 0] bbl_publisher processed : Sabine Wespieser
[worker 0] bbl_isbn processed : 9782848054926
[worker 0] bbl_pubdate processed : 2023-01-07 00:00:00
[worker 0] parse_meta() returns bbl_isbn, bbl_publisher, bbl_pubdate : 9782848054926 Sabine Wespieser 2023-01-07 00:00:00
[worker 0] Temps après parse_meta() ... : 0.01202702522277832

[worker 0] in parse_rating(self, soup)
[worker 0] parse_rating() returns bbl_rating : 4.0, bbl_rating_cnt : 28
[worker 0] Temps après parse_rating() ... : 0.014027118682861328

[worker 0] in parse_tags(self, soup)
[worker 0] parse_tags() return bbl_tags ['Roman Étranger', 'Littérature Générale', 'Rentrée Littéraire 2023', 'Roman', 'Amitié', 'Quartier Populaire', 'Littérature', 'Café', 'Littérature Allemande', 'Vienne', 'Littérature Autrichienne', 'Après-Guerre']
[worker 0] Temps après parse_tags() ... : 0.01706409454345703

[worker 0] in parse_cover(self, soup)
[worker 0] parse_cover() returns bbl_cover : https://www.babelio.com/couv/CVT_Le-...s-nom_6541.jpg
[worker 0] Temps après parse_cover() ... : 0.017557859420776367

[worker 0] in parse_comments(self, soup)
[worker 0] onclick : javascript:voir_plus_a('#d_bio',1,1398241);
[worker 0] calling ret_soup(log, dbg_lvl, br, url, rkt=rkt, who=self.who
[worker 0] url : https://www.babelio.com/aj_voir_plus_a.php
[worker 0] rkt : {'type': '1', 'id_obj': '1398241'}
[worker 0] In ret_soup(log, dbg_lvl, br, url, rkt={'type': '1', 'id_obj': '1398241'}, who=[worker 0])

[worker 0] URL request time : 15:39:05
[worker 0] br : <Browser visiting https://www.babelio.com/livres/Seethaler-Le-Cafe-sans-nom/1525266>
[worker 0] url : https://www.babelio.com/aj_voir_plus_a.php
[worker 0] rkt : {'type': '1', 'id_obj': '1398241'}
[worker 0] Accessing url : https://www.babelio.com/aj_voir_plus_a.php
[worker 0] search parameters : {'type': '1', 'id_obj': '1398241'}
[worker 0] formated parameters : type=1&id_obj=1398241
[worker 0] In urlopen_with_retry(log, dbg_lvl, br, url, rkt=b'type=1&id_obj=1398241', who=[worker 0])

[worker 0] (urlopen_with_retry) sr.getcode() : 200
[worker 0] url_vrai : https://www.babelio.com/aj_voir_plus_a.php
[worker 0] sr.info() : Server: nginx
Date: Thu, 26 Oct 2023 13:39:04 GMT
Content-Type: text/html; charset=ISO-8859-1
Connection: close
Cache-Control: no-cache
Expires: Thu, 26 Oct 2023 13:39:03 GMT
Vary: Accept-Encoding
X-Frame-Options: SAMEORIGIN


[worker 0] Temps après parse_comments() ... : 1.2789580821990967

timing of the accesses to Babelio for this book
When : Thu Oct 26 15:39:02 2023; Who : [__init__]; Where : https://www.babelio.com/recherche
When : Thu Oct 26 15:39:04 2023; Who : [worker 0]; Where : https://www.babelio.com/livres/Seeth...ns-nom/1525266
When : Thu Oct 26 15:39:05 2023; Who : [worker 0]; Where : https://www.babelio.com/aj_voir_plus_a.php

************************************************** ******************************
The identify phase took 3.25 seconds
The longest time (3.093478) was taken by: Babelio_db
Merging results from different sources
We have 1 merged results, merging took: 0.00 seconds



En tous cas merci... Le plugin est au top.

Last edited by theducks; 10-26-2023 at 10:22 AM. Reason: SPOILER LOG files
capichou is offline   Reply With Quote
Old 10-26-2023, 10:08 AM   #26
capichou
Junior Member
capichou began at the beginning.
 
Posts: 5
Karma: 10
Join Date: Oct 2023
Device: Kobo Libra H2O
J'ai fait un test complémentaire, je ne sais pas si ça peut aider...

J'ai téléchargé proprement les métadonnées d'un livre en entrant l'URL/id babelio. Ca a fonctionné nickel. J'ai ensuite supprimé l'id, et tenté de retélécharger, avec normalement donc des infos titre/auteur parfaites. Même résultat :
Spoiler:


Running identify query with parameters:
{'title': 'Le vieil homme et la guerre', 'authors': ['John Scalzi'], 'identifiers': {}, 'timeout': 30}
Using plugins: Babelio_db (0, 8, 5)
The log from individual plugins is below

****************************** Babelio_db (0, 8, 5) ******************************
Found 2 results
Downloading from Babelio_db took 5.725470304489136


---
Title : Fiche de lecture : La vie est facile, ne t'inquiète pas d'Agnès Martin-Lugand
Author(s) : lePetitLittéraire.fr & Ludivine Auneau
Publisher : lePetitLittéraire.fr
Tags : Littérature Générale, Roman, Littérature Francophone
Languages : fr
Rating : 2.3
Published : 2015-01-05T22:00:00+00:00
Identifiers : isbn:9782806265739, babelio_id:lePetitLitterairefr-Fiche-de-lecture--La-vie-est-facile-ne-tinquiete/929100
Comments : b'\n
\n
\n
\n Référence:\n \n https://www.babelio.com/livres/lePet...uiete/929100\n \n
\n
\n
\n\n\n
\n
\n

\n
\n Popularité\n
\n

\n
\n
\n\n\n
\n
\n
\n Le nombre de cotations est\n \n 18\n \n , avec une note moyenne de\n \n 4.67\n \n sur 5\n
\n
\n
\n\n\n
\n
\n

\n
\n Résumé\n
\n

\n
\n
\n\n\n \n
\n Décryptez La vie est facile, ne t\'inquiète pas d\'Agnès MartinLugand avec l\'analyse du PetitLitteraire.fr !\n
\n Que fautil retenir de La vie est facile, ne t\'inquiète pas, roman sentimental contemporain ? Retrouvez tout ce que vous devez savoir sur cette oeuvre dans une fiche de lecture complète et détaillée.\n
\n Vous trouverez notamment dans cette fiche :\n
\n * Un résumé complet\n
\n * Une présentation des personnages principaux tels que Diane et Edward\n
\n * Une analyse des spécificités de l\'oeuvre : Un roman sentimental, Deuil et reconstruction de soi, Un besoin d\'appartenance\n
\n Une analyse de référence pour comprendre rapidement le sens de l\'oeuvre.\n
\n Le Mot De L\'ÉDiteur :\n
\n « Dans cette nouvelle édition de notre analyse de La vie est facile, ne t\'inquiète pas (2015), avec Ludivine Auneau, nous fournissons des pistes pour décoder ce roman sentimental contemporain. Notre analyse permet de faire rapidement le tour de l\'oeuvre et d\'aller audelà des clichés. » Juliette Nève\n
\n À propos de la collection LePetitLitteraire.fr :\n
\n Plébiscité tant par les passionnés de littérature que par les lycéens, LePetitLittéraire.fr est considéré comme une référence en matière d\'analyse d\'oeuvres classiques et contemporaines. Nos analyses, disponibles aux formats papier et numérique, ont été conçues pour guider les lecteurs à travers toute la littérature. Nos auteurs combinent théories, citations, anecdotes et commentaires pour vous faire découvrir et redécouvrir les plus grandes oeuvres littéraires.\n
\n LePetitLittéraire.fr est reconnu d\'intérêt pédagogique par le ministère de l\'Éducation.\n
\n
\n'


---
Title : Fiche de lecture : Les gens heureux lisent et boivent du café d'Agnès Martin-Lugand
Author(s) : lePetitLittéraire.fr & Sophie Piret
Publisher : lePetitLittéraire.fr
Tags : Littérature Générale, Roman, Littérature Francophone
Languages : fr
Rating : 2.5
Published : 2015-01-05T22:00:00+00:00
Identifiers : isbn:9782806265791, babelio_id:lePetitLitterairefr-Fiche-de-lecture--Les-gens-heureux-lisent-et-boiv/1044725
Comments : b'\n
\n
\n
\n Référence:\n \n https://www.babelio.com/livres/lePet...boiv/1044725\n \n
\n
\n
\n\n\n
\n
\n

\n
\n Popularité\n
\n

\n
\n
\n\n\n
\n
\n
\n Le nombre de cotations est\n \n 10\n \n , avec une note moyenne de\n \n 4.95\n \n sur 5\n
\n
\n
\n\n\n
\n
\n

\n
\n Résumé\n
\n

\n
\n
\n\n\n \n
\n Décryptez Les gens heureux lisent et boivent du café d\'Agnès Martin-Lugand avec l\'analyse du PetitLitteraire.fr !\n
\n Que faut-il retenir des Gens heureux lisent et boivent du café, le succès des librairies 2013 ? Retrouvez tout ce que vous devez savoir sur cette oeuvre dans une fiche de lecture complète et détaillée.\n
\n Vous trouverez notamment dans cette fiche :\n
\n * Un résumé complet\n
\n * Une présentation des personnages principaux tels que Diane et Edward\n
\n * Une analyse des spécificités de l\'oeuvre : Le deuil et le chemin vers la guérison\n
\n Une analyse de référence pour comprendre rapidement le sens de l\'oeuvre.\n
\n Le Mot De L\'ÉDiteur :\n
\n « Dans cette nouvelle édition de notre analyse des Gens heureux lisent et boivent du café (2015), avec Piret Sophie, nous fournissons des pistes pour décoder ce succès des librairies 2013. Notre analyse permet de faire rapidement le tour de l\'oeuvre et d\'aller au-delà des clichés. » Juliette Nève\n
\n
\n'
-+-+-+-+-+-+-+-+-+-+ Entry point +-+-+-+-+-+-+-+-+-+-
self.dgb_lvl : 15
self.with_cover : True
self.with_pretty_comments : True
self.with_detailed_rating : True
self.tag_genre : 12
self.tag_theme : 12
self.tag_lieu : 12
self.tag_quand : 12

In identify(self, log, result_queue, abort, title=.., authors=.., identifiers=.., timeout=30)

title : Le vieil homme et la guerre
identifiers : {}
authors : ['John Scalzi']
Pas de résultat avec babelio_id ou avec l'ISBN, on recherche les auteurs et le titre.

in create_query()

title : Le vieil homme et la guerre
authors : ['John Scalzi']

In ret_clean_txt(self, log, text, who='')

text : John Scalzi
cleaned text : john scalzi
return text from ret_clean_txt

In ret_clean_txt(self, log, text, who='')

text : Le vieil homme et la guerre
cleaned text : le vieil homme et la guerre
return text from ret_clean_txt
return url from create_query : https://www.babelio.com/recherche
return rkt from create_query : {'Recherche': 'john scalzi le vieil homme et la guerre'}
In ret_soup(log, dbg_lvl, br, url, rkt={'Recherche': 'john scalzi le vieil homme et la guerre'}, who=)

URL request time : 16:05:44
br :
url : https://www.babelio.com/recherche
rkt : {'Recherche': 'john scalzi le vieil homme et la guerre'}
Accessing url : https://www.babelio.com/recherche
search parameters : {'Recherche': 'john scalzi le vieil homme et la guerre'}
formated parameters : Recherche=john+scalzi+le+vieil+homme+et+la+guerre
In urlopen_with_retry(log, dbg_lvl, br, url, rkt=b'Recherche=john+scalzi+le+vieil+homme+et+la+g uerre', who=)

(urlopen_with_retry) sr.getcode() : 200
url_vrai : https://www.babelio.com/recherche
sr.info() : Server: nginx
Date: Thu, 26 Oct 2023 14:05:44 GMT
Content-Type: text/html; charset=ISO-8859-1
Connection: close
Set-Cookie: p=BE; expires=Fri, 25-Oct-2024 14:05:44 GMT; Max-Age=31536000
Set-Cookie: disclaimer=1; expires=Fri, 25-Oct-2024 14:05:44 GMT; Max-Age=31536000
Cache-Control: no-cache
Expires: Thu, 26 Oct 2023 14:05:43 GMT
Vary: Accept-Encoding
X-Frame-Options: SAMEORIGIN
content-type: text/html; charset=iso-8859-1
content-language: fr-FR
cache-control: no-cache
pragma: no-cache
expires: -1
x-ua-compatible: IE=edge


In parse_search_results(self, log, orig_title, orig_authors, soup, br)
orig_title : Le vieil homme et la guerre
orig_authors : ['john scalzi']
display each item found



Fiche de lecture : La vie est facile, ne t'inquiète pas d'Agnès Martin-Lugand




lePetitLittéraire.fr



4.67★

(47)




In ret_clean_txt(self, log, text, who='')

text : Fiche de lecture : La vie est facile, ne t'inquiète pas d'Agnès Martin-Lugand
cleaned text : fiche de lecture la vie est facile ne t inquiete pas d agnes martin lugand
return text from ret_clean_txt

In ret_clean_txt(self, log, text, who='')

text : Le vieil homme et la guerre
cleaned text : le vieil homme et la guerre
return text from ret_clean_txt

In ret_clean_txt(self, log, text, who='')

text : lePetitLittéraire.fr
cleaned text : lepetitlitteraire fr
return text from ret_clean_txt

In ret_clean_txt(self, log, text, who='')

text : john scalzi
cleaned text : john scalzi
return text from ret_clean_txt
titre : Fiche de lecture : La vie est facile, ne t'inquiète pas d'Agnès Martin-Lugand, auteur : lePetitLittéraire.fr, sous_url : /livres/lePetitLitterairefr-Fiche-de-lecture--La-vie-est-facile-ne-tinquiete/929100
display each item found



Fiche de lecture : Les gens heureux lisent et boivent du café d'Agnès Martin-Lugand




lePetitLittéraire.fr



4.95★

(20)




In ret_clean_txt(self, log, text, who='')

text : Fiche de lecture : Les gens heureux lisent et boivent du café d'Agnès Martin-Lugand
cleaned text : fiche de lecture les gens heureux lisent et boivent du cafe d agnes martin lugand
return text from ret_clean_txt

In ret_clean_txt(self, log, text, who='')

text : Le vieil homme et la guerre
cleaned text : le vieil homme et la guerre
return text from ret_clean_txt

In ret_clean_txt(self, log, text, who='')

text : lePetitLittéraire.fr
cleaned text : lepetitlitteraire fr
return text from ret_clean_txt

In ret_clean_txt(self, log, text, who='')

text : john scalzi
cleaned text : john scalzi
return text from ret_clean_txt
titre : Fiche de lecture : Les gens heureux lisent et boivent du café d'Agnès Martin-Lugand, auteur : lePetitLittéraire.fr, sous_url : /livres/lePetitLitterairefr-Fiche-de-lecture--Les-gens-heureux-lisent-et-boiv/1044725
nombre de références trouvées dans babelio 2
nombre de matches : 2
matches at return time :
https://www.babelio.com/livres/lePet...t-boiv/1044725
https://www.babelio.com/livres/lePet...nquiete/929100
matches : ['https://www.babelio.com/livres/lePetitLitterairefr-Fiche-de-lecture--Les-gens-heureux-lisent-et-boiv/1044725', 'https://www.babelio.com/livres/lePetitLitterairefr-Fiche-de-lecture--La-vie-est-facile-ne-tinquiete/929100']
[worker 0] entry time : Thu Oct 26 16:05:45 2023
[worker 0] self.url : https://www.babelio.com/livres/lePet...t-boiv/1044725
[worker 0] self.relevance : 0
[worker 0] self.plugin :
[worker 0] self.dbg_lvl : 15
[worker 0] self.timeout : 20
[worker 0] self.with_cover : True
[worker 0] self.with_pretty_comments : True
[worker 0] self.with_detailed_rating : True
[worker 0] self.tag_genre : 12
[worker 0] self.tag_theme : 12
[worker 0] self.tag_lieu : 12
[worker 0] self.tag_quand : 12
[worker 1] entry time : Thu Oct 26 16:05:45 2023
[worker 1] self.url : https://www.babelio.com/livres/lePet...nquiete/929100
[worker 1] self.relevance : 1
[worker 1] self.plugin :
[worker 1] self.dbg_lvl : 15
[worker 1] self.timeout : 20
[worker 1] self.with_cover : True
[worker 1] self.with_pretty_comments : True
[worker 1] self.with_detailed_rating : True
[worker 1] self.tag_genre : 12
[worker 1] self.tag_theme : 12
[worker 1] self.tag_lieu : 12
[worker 1] self.tag_quand : 12
submit time : Thu Oct 26 16:05:45 2023

[worker 0] in run(self)

[worker 0] in get_details(self)
[worker 0] in get details(), start time : 1698329145.0497863
[worker 0] calling ret_soup(log, dbg_lvl, br, url, rkt=None, who='')
[worker 0] self.url : https://www.babelio.com/livres/lePet...t-boiv/1044725
submit time : Thu Oct 26 16:05:45 2023

[worker 1] in run(self)

[worker 1] in get_details(self)
[worker 1] in get details(), start time : 1698329145.0512965
[worker 1] calling ret_soup(log, dbg_lvl, br, url, rkt=None, who='')
[worker 1] self.url : https://www.babelio.com/livres/lePet...nquiete/929100
[worker 0] In ret_soup(log, dbg_lvl, br, url, rkt=None, who=[worker 0])

[worker 0] URL request time : 16:05:46
[worker 0] br :
[worker 0] url : https://www.babelio.com/livres/lePet...t-boiv/1044725
[worker 0] rkt : None
[worker 0] Accessing url : https://www.babelio.com/livres/lePet...t-boiv/1044725
[worker 0] In urlopen_with_retry(log, dbg_lvl, br, url, rkt=None, who=[worker 0])

[worker 0] (urlopen_with_retry) sr.getcode() : 200
[worker 0] url_vrai : https://www.babelio.com/livres/lePet...t-boiv/1044725
[worker 0] sr.info() : Server: nginx
Date: Thu, 26 Oct 2023 14:05:45 GMT
Content-Type: text/html; charset=ISO-8859-1
Connection: close
Cache-Control: no-cache
Expires: Thu, 26 Oct 2023 14:05:44 GMT
Vary: Accept-Encoding
X-Frame-Options: SAMEORIGIN
content-type: text/html; charset=iso-8859-1
content-language: fr-FR
cache-control: no-cache
pragma: no-cache
expires: -1
x-ua-compatible: IE=edge


[worker 0] Temps après ret_soup()... : 1.3484470844268799

[worker 0] in parse_bbl_id
[worker 0] bbl_id : lePetitLitterairefr-Fiche-de-lecture--Les-gens-heureux-lisent-et-boiv/1044725
[worker 0] Temps après parse_bbl_id() ... : 1.3484470844268799

[worker 0] in parse_details(self, soup)
[worker 0] in parse_details(), new start : 1698329146.3982334

[worker 0] in parse_authors(self, soup)
[worker 0] return bbl_authors ['lePetitLittéraire.fr', 'Sophie Piret']
[worker 0] Temps après parse_authors() ... : 0.0020036697387695312

[worker 0] in parse_title_series(self, soup, bbl_authors)
[worker 0] bbl_title : Fiche de lecture : Les gens heureux lisent et boivent du café d'Agnès Martin-Lugand
[worker 0] name : lePetitLittéraire.fr
[worker 0] name : Sophie Piret
[worker 0] bbl_title : Fiche de lecture : Les gens heureux lisent et boivent du café d'Agnès Martin-Lugand
[worker 0] Temps après parse_title_series() ... : 0.004499912261962891

[worker 0] in parse_meta(self, soup)
[worker 0] bbl_publisher processed : lePetitLittéraire.fr
[worker 0] bbl_isbn processed : 9782806265791
[worker 0] bbl_pubdate processed : 2015-01-06 00:00:00
[worker 0] parse_meta() returns bbl_isbn, bbl_publisher, bbl_pubdate : 9782806265791 lePetitLittéraire.fr 2015-01-06 00:00:00
[worker 0] Temps après parse_meta() ... : 0.00700068473815918

[worker 0] in parse_rating(self, soup)
[worker 0] parse_rating() returns bbl_rating : 4.95, bbl_rating_cnt : 10
[worker 0] Temps après parse_rating() ... : 0.009003162384033203

[worker 0] in parse_tags(self, soup)
[worker 0] parse_tags() return bbl_tags ['Littérature Générale', 'Roman', 'Littérature Francophone']
[worker 0] Temps après parse_tags() ... : 0.01200246810913086

[worker 0] in parse_cover(self, soup)
[worker 0] parse_cover() returns bbl_cover : https://images-eu.ssl-images-amazon....5L._SX195_.jpg
[worker 0] Temps après parse_cover() ... : 0.012503385543823242

[worker 0] in parse_comments(self, soup)
[worker 0] onclick : javascript:voir_plus_a('#d_bio',1,918768);
[worker 0] calling ret_soup(log, dbg_lvl, br, url, rkt=rkt, who=self.who
[worker 0] url : https://www.babelio.com/aj_voir_plus_a.php
[worker 0] rkt : {'type': '1', 'id_obj': '918768'}
[worker 0] In ret_soup(log, dbg_lvl, br, url, rkt={'type': '1', 'id_obj': '918768'}, who=[worker 0])

[worker 0] URL request time : 16:05:47
[worker 0] br :
[worker 0] url : https://www.babelio.com/aj_voir_plus_a.php
[worker 0] rkt : {'type': '1', 'id_obj': '918768'}
[worker 0] Accessing url : https://www.babelio.com/aj_voir_plus_a.php
[worker 0] search parameters : {'type': '1', 'id_obj': '918768'}
[worker 0] formated parameters : type=1&id_obj=918768
[worker 0] In urlopen_with_retry(log, dbg_lvl, br, url, rkt=b'type=1&id_obj=918768', who=[worker 0])

[worker 0] (urlopen_with_retry) sr.getcode() : 200
[worker 0] url_vrai : https://www.babelio.com/aj_voir_plus_a.php
[worker 0] sr.info() : Server: nginx
Date: Thu, 26 Oct 2023 14:05:46 GMT
Content-Type: text/html; charset=ISO-8859-1
Connection: close
Cache-Control: no-cache
Expires: Thu, 26 Oct 2023 14:05:45 GMT
Vary: Accept-Encoding
X-Frame-Options: SAMEORIGIN


[worker 0] Temps après parse_comments() ... : 1.2786262035369873
[worker 1] In ret_soup(log, dbg_lvl, br, url, rkt=None, who=[worker 1])

[worker 1] URL request time : 16:05:48
[worker 1] br :
[worker 1] url : https://www.babelio.com/livres/lePet...nquiete/929100
[worker 1] rkt : None
[worker 1] Accessing url : https://www.babelio.com/livres/lePet...nquiete/929100
[worker 1] In urlopen_with_retry(log, dbg_lvl, br, url, rkt=None, who=[worker 1])

[worker 1] (urlopen_with_retry) sr.getcode() : 200
[worker 1] url_vrai : https://www.babelio.com/livres/lePet...nquiete/929100
[worker 1] sr.info() : Server: nginx
Date: Thu, 26 Oct 2023 14:05:48 GMT
Content-Type: text/html; charset=ISO-8859-1
Connection: close
Cache-Control: no-cache
Expires: Thu, 26 Oct 2023 14:05:47 GMT
Vary: Accept-Encoding
X-Frame-Options: SAMEORIGIN
content-type: text/html; charset=iso-8859-1
content-language: fr-FR
cache-control: no-cache
pragma: no-cache
expires: -1
x-ua-compatible: IE=edge


[worker 1] Temps après ret_soup()... : 4.009915113449097

[worker 1] in parse_bbl_id
[worker 1] bbl_id : lePetitLitterairefr-Fiche-de-lecture--La-vie-est-facile-ne-tinquiete/929100
[worker 1] Temps après parse_bbl_id() ... : 4.009915113449097

[worker 1] in parse_details(self, soup)
[worker 1] in parse_details(), new start : 1698329149.0612116

[worker 1] in parse_authors(self, soup)
[worker 1] return bbl_authors ['lePetitLittéraire.fr', 'Ludivine Auneau']
[worker 1] Temps après parse_authors() ... : 0.0024993419647216797

[worker 1] in parse_title_series(self, soup, bbl_authors)
[worker 1] bbl_title : Fiche de lecture : La vie est facile, ne t'inquiète pas d'Agnès Martin-Lugand
[worker 1] name : lePetitLittéraire.fr
[worker 1] name : Ludivine Auneau
[worker 1] bbl_title : Fiche de lecture : La vie est facile, ne t'inquiète pas d'Agnès Martin-Lugand
[worker 1] Temps après parse_title_series() ... : 0.005499124526977539

[worker 1] in parse_meta(self, soup)
[worker 1] bbl_publisher processed : lePetitLittéraire.fr
[worker 1] bbl_isbn processed : 9782806265739
[worker 1] bbl_pubdate processed : 2015-01-06 00:00:00
[worker 1] parse_meta() returns bbl_isbn, bbl_publisher, bbl_pubdate : 9782806265739 lePetitLittéraire.fr 2015-01-06 00:00:00
[worker 1] Temps après parse_meta() ... : 0.006999969482421875

[worker 1] in parse_rating(self, soup)
[worker 1] parse_rating() returns bbl_rating : 4.67, bbl_rating_cnt : 18
[worker 1] Temps après parse_rating() ... : 0.009000778198242188

[worker 1] in parse_tags(self, soup)
[worker 1] parse_tags() return bbl_tags ['Littérature Générale', 'Roman', 'Littérature Francophone']
[worker 1] Temps après parse_tags() ... : 0.012037992477416992

[worker 1] in parse_cover(self, soup)
[worker 1] parse_cover() returns bbl_cover : https://images-eu.ssl-images-amazon....ML._SX195_.jpg
[worker 1] Temps après parse_cover() ... : 0.012501716613769531

[worker 1] in parse_comments(self, soup)
[worker 1] onclick : javascript:voir_plus_a('#d_bio',1,800100);
[worker 1] calling ret_soup(log, dbg_lvl, br, url, rkt=rkt, who=self.who
[worker 1] url : https://www.babelio.com/aj_voir_plus_a.php
[worker 1] rkt : {'type': '1', 'id_obj': '800100'}
[worker 1] In ret_soup(log, dbg_lvl, br, url, rkt={'type': '1', 'id_obj': '800100'}, who=[worker 1])

[worker 1] URL request time : 16:05:50
[worker 1] br :
[worker 1] url : https://www.babelio.com/aj_voir_plus_a.php
[worker 1] rkt : {'type': '1', 'id_obj': '800100'}
[worker 1] Accessing url : https://www.babelio.com/aj_voir_plus_a.php
[worker 1] search parameters : {'type': '1', 'id_obj': '800100'}
[worker 1] formated parameters : type=1&id_obj=800100
[worker 1] In urlopen_with_retry(log, dbg_lvl, br, url, rkt=b'type=1&id_obj=800100', who=[worker 1])

[worker 1] (urlopen_with_retry) sr.getcode() : 200
[worker 1] url_vrai : https://www.babelio.com/aj_voir_plus_a.php
[worker 1] sr.info() : Server: nginx
Date: Thu, 26 Oct 2023 14:05:49 GMT
Content-Type: text/html; charset=ISO-8859-1
Connection: close
Cache-Control: no-cache
Expires: Thu, 26 Oct 2023 14:05:48 GMT
Vary: Accept-Encoding
X-Frame-Options: SAMEORIGIN


[worker 1] Temps après parse_comments() ... : 1.2842841148376465

timing of the accesses to Babelio for this book
When : Thu Oct 26 16:05:45 2023; Who : [__init__]; Where : https://www.babelio.com/recherche
When : Thu Oct 26 16:05:46 2023; Who : [worker 0]; Where : https://www.babelio.com/livres/lePet...t-boiv/1044725
When : Thu Oct 26 16:05:47 2023; Who : [worker 0]; Where : https://www.babelio.com/aj_voir_plus_a.php
When : Thu Oct 26 16:05:49 2023; Who : [worker 1]; Where : https://www.babelio.com/livres/lePet...nquiete/929100
When : Thu Oct 26 16:05:50 2023; Who : [worker 1]; Where : https://www.babelio.com/aj_voir_plus_a.php

************************************************** ******************************
The identify phase took 5.75 seconds
The longest time (5.725470) was taken by: Babelio_db
Merging results from different sources
We have 2 merged results, merging took: 0.00 seconds

Last edited by theducks; 10-26-2023 at 10:24 AM. Reason: spoilered log
capichou is offline   Reply With Quote
Old 10-27-2023, 03:28 PM   #27
lrpirlet
Connoisseur
lrpirlet began at the beginning.
 
Posts: 93
Karma: 40
Join Date: Mar 2020
Location: Belgium (sorry, I am from the Walloon side of the country and I speak french only)
Device: PW3, Kobo Libra H2O
Quote:
Originally Posted by capichou View Post
Hello,

Je viens de faire la mise à jour... Ça a fonctionné pour quelques livres, mais ça me renvoie maintenant des résultats aberrants. Voici un log avec verbosité à 15 comme demandé :

Running identify query with parameters:
{'title': 'Janua Vera', 'authors': ['Jean-Philippe Jaworski'], 'identifiers': {}, 'timeout': 30}
Using plugins: Babelio_db (0, 8, 5)
The log from individual plugins is below
Voyons ce log

Code:
****************************** Babelio_db (0, 8, 5)
OK, c'est la dernière version de mobileread

Code:
...deleted...

-+-+-+-+-+-+-+-+-+-+ Entry point +-+-+-+-+-+-+-+-+-+-
self.dgb_lvl              :  15
self.with_cover           :  True
self.with_pretty_comments :  True
self.with_detailed_rating :  True
self.tag_genre            :  12
self.tag_theme            :  12
self.tag_lieu             :  12
self.tag_quand            :  12

In identify(self, log, result_queue, abort, title=.., authors=.., identifiers=.., timeout=30)

title             :  Janua Vera
identifiers       :  {}
authors           :  ['Jean-Philippe Jaworski'] <class 'list'>

return url from create_query :  https://www.babelio.com/recherche
return rkt from create_query :  {'Recherche': 'jean philippe jaworski janua vera'}
 In ret_soup(log, dbg_lvl, br, url, rkt={'Recherche': 'jean philippe jaworski janua vera'}, who=)

 ...deleted...

 (urlopen_with_retry) sr.getcode()  :  200
OK, tu demande debug=15, la couverture, le pretty comment et le rating détaillé... pas de filtrage sur les tags.

On accède a la page babelio de recherche par https://www.babelio.com/recherche
et on remplit la fenêtre de recherche avec rkt: jean philippe jaworski janua vera
Babelio.com retourne une réponse 200 (tout va bien) et le résultat de la requête (en format html)

Maintenant, on ouvre le résultat, sous display each item found (un print de développement que je dois retirer pour la version hors test), la class="titre_txt" doit me donner le titre du/des livre(s) trouvé(s)...

Code:
In parse_search_results(self, log, orig_title, orig_authors, soup, br)
orig_title    :  Janua Vera
orig_authors  :  ['jean philippe jaworski']
display each item found
 <div class="cr_meta">
 <div class="livres_txt">
  <a class="titre1" href="/livres/Seethaler-Le-Cafe-sans-nom/1525266">
   Le Café sans nom
  </a>
 </div>
 <div class="sgst_auteur_txt" style="font-size: .65rem;">
  <a class="libelle" href="/auteur/Robert-Seethaler/329203">
   Robert Seethaler
  </a>
  <br/>
  4.06★
													 	
						 	(148)
 </div>
</div>
OK, on ne va pas plus loin... Visiblement Babelio.com a retourné autre chose...

Voyons voir, je télécharge le zip de mobileread et l'installe... je suis dans les même conditions... ça marche sans problème pour moi, j'obtient les bons résultats



Voyons voir ta deuxième entrée: je crèe un livre vide avec titre: le vieil homme et la guerre de John Scalzi, babelio_db me trouve le bouquin sans problème



Voyons voir les timings



Ha oui même période de temps pour les 2 bouquins... Je pense que Babelio.com était en "maintenance mode". Peut-être travaillait-on sur le module de recherche???

Accessoirement, merci pour ce post, j'ai vu qu'il y a peut-être moyen de ne pas examiner toutes les entrées (et donc de réduire le risque de bannissement par Babelio.com) si tant l'auteur que le titre trouvé est strictement égal à l'auteur et au titre demandé.

Last edited by lrpirlet; 10-27-2023 at 04:01 PM.
lrpirlet is offline   Reply With Quote
Old 10-29-2023, 09:32 AM   #28
capichou
Junior Member
capichou began at the beginning.
 
Posts: 5
Karma: 10
Join Date: Oct 2023
Device: Kobo Libra H2O
Quote:
Originally Posted by lrpirlet View Post
...
Désolé de t'avoir fait creuser pour rien alors, vu que le souci était du côté de babelio. Et merci pour l'analyse détaillée, ça permet de comprendre, c'est cool.
capichou is offline   Reply With Quote
Old 10-29-2023, 09:53 AM   #29
lrpirlet
Connoisseur
lrpirlet began at the beginning.
 
Posts: 93
Karma: 40
Join Date: Mar 2020
Location: Belgium (sorry, I am from the Walloon side of the country and I speak french only)
Device: PW3, Kobo Libra H2O
Quote:
Originally Posted by capichou View Post
Désolé de t'avoir fait creuser pour rien alors, vu que le souci était du côté de babelio. Et merci pour l'analyse détaillée, ça permet de comprendre, c'est cool.
OK , l'analyse détaillée c'est pour que le log serve aussi a ceux qui utilise Babelio_db... Parfois, si on comprend un log on arrive à se dépanner sois même.

Fait creuser pour rien? Non, pas du tout... Si on accède à url : https://www.babelio.com/recherche, on reçoit une page de babelio... Si on tape dans la boite de recherche le texte john scalzi le vieil homme et la guerre, suivit de retour chariot, on obtient six livres.

Babelio_db version 085 examinait chaque livre et (si les paramètres de calibre le permet) donnait le choix entre ces 6 livres... soit 6 x 3 ou 4 accès alors que 1 seul est necessaire (on a le titre et un auteur exactement identiques dans calibre et dans babelio.com)

Babelio_db version 086 , si il trouve un match exact, tant entre le titre (débarrassé de la partie série) et le titre demandé qu'entre un auteur et l'auteur demandé, ne cherchera les données que sur le "perfect match".

Last edited by lrpirlet; 10-30-2023 at 11:13 AM.
lrpirlet is offline   Reply With Quote
Old 10-31-2023, 07:21 PM   #30
Leilu
Member
Leilu began at the beginning.
 
Posts: 18
Karma: 10
Join Date: Feb 2023
Device: Kindle Oasis 3 / Kobo Libra 2
Bonjour,

Merci pour ce plugin. Ma bibliothèque Calibre est bien mieux organisée depuis que je l'utilise.

Est-ce possible d'avoir la main sur l'édition au moment du téléchargement des metadatas svp ? La plupart du temps ce n'est pas la bonne.

Parfois, j'aimerais seulement récupérer le babelio_id rapidement sans écraser tous les autres champs. Comment pourrais-je faire svp ? Merci
Leilu is offline   Reply With Quote
Reply


Forum Jump

Similar Threads
Thread Thread Starter Forum Replies Last Post
[Metadata Source Plugin] Comicvine chewt0y Plugins 88 07-11-2022 12:00 PM
[Metadata Source Plugin] INMONDADORI Pr.BarnArt Plugins 7 12-03-2021 12:56 PM
Read a book's metadata in a Metadata source plugin? J-H Development 2 03-30-2021 09:08 AM
[Metadata Source Plugin] Empty Plugin? (Fake Identifier) mneimeyer Plugins 3 11-11-2019 08:07 PM
[Metadata Source Plugin] LubimyCzytac [PL] jbienko1 Plugins 33 01-23-2017 06:15 AM


All times are GMT -4. The time now is 04:08 AM.


MobileRead.com is a privately owned, operated and funded community.