View Single Post
Old 12-29-2020, 05:22 AM   #38
hegi
Enthusiast
hegi began at the beginning.
 
Posts: 44
Karma: 10
Join Date: Dec 2012
Device: Kindle 4 & Kindle PW 3G
Hi Divingduck,
thanks a lot for your quick reply and the new version of the recipe.

According to your comments, this is the from March 2018, when we wrote about this the last time. - However, when doing a quick diff on the versions, there seems to be some changes.

I currently load both versions (mine and this one) to compare the output.
Cut it be, that you ommitted updating the comments (date/version) on your last adaptations?

According to my analysis the most relevant difference between our versions is the following code within my recipe:

Quote:
# don't duplicate articles from "Schlagzeilen" / "Exklusiv" to other rubrics
ignore_duplicate_articles = {'title', 'url'}
However, the problem observed remains. If there are picture-galleries like in this article (https://www.wiwo.de/unternehmen/auto.../26185402.html), you get in the output only the text of the gallery like this:

Quote:
1 / 8

Volkswagens neues E-Modell ID.4 feierte Ende September digitale Weltpremiere. Vorbestellt werden konnte er schon, nun soll er in den ersten Wochen des neuen Jahres auch zu den Kunden rollen.

Bild: Volkswagen

2 / 8

Wo der ID.3 in der schrumpfenden Kompaktklasse antritt, startet der ID.4 im Boom-Segment der handlichen Geländewagen. Und während es den einen nur in Europa geben wird, feiern die Niedersachsen den anderen als Weltauto. Kein anderes Auto, so meint man bei VW, wird wichtiger im Kampf gegen Tesla & Co. Kein Wunder also, dass der Konzern reichlich trommelt für den elektrischen Weltbürger in Spe und bereits vor der offiziellen Enthüllung im Spätsommer zu einer ersten Ausfahrt im nur noch dezent getarnten Prototypen auf das sonst so streng geheime Testgelände in Ehra-Lessien bat.

Bild: Volkswagen
Any ideas as how to tackle this issue?

Thanks a lot in advance ...

Hegi.
hegi is offline   Reply With Quote