![]() |
#1 |
Dry fruit
![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Posts: 1,157
Karma: 1047086
Join Date: Dec 2008
Location: Paris, France
Device: Bookeen Opus + HTC Desire HD
|
Gallica... euh : se f... de notre g... ?
Je résume les épisodes précédents
![]() J'ai repris le scan (très défectueux) de Gallica "les Dieux ont soif" (Anatole France) et je l'ai mis au carré : corrections, mise en page, upload sur FeedBooks... Le scan original est annoncé avec Un score OCR de 98%... petit calcul : une page A4 a 2000 signes => 2% d'erreur = 20 pour mille et 40 pour deux mille (vous suivez là derrière?). Qaurante caractères reconnus erronés sur une page A4 (plus les faux négatifs--erreurs qui n'en sont pas-- et les faux positifs --erreurs non détectées). Mon texte final, corrigé est nickel : passé au correcteur orthographique 3 fois, etc. Ni une ni deux je me dis "offrons la bête à Gallica, qui sera contente!" et donc j'écris :! Pour : <gallica2@bnf.fr> Objet : Proposition de texte corrigé : "les Dieux ont soif" J'ai corrigé le contenu du roman d'Anatole France "les Dieux ont soif"; je me demandais s'il est possible de vous le retransmettre pour le mettre à disposition, sachant qu'il est de bien meilleure qualité que celui qui est disponible sur Gallica? Bien à vous Yves G. Réponse (un moment après): deAssistance.Gallica@bnf.frdate26 mai 2009 17:13objetRéf. : Proposition de texte corrigé : "les Dieux ont soif" Bonjour J'ai pris connaissance avec intérêt de votre proposition, qui a déjà été étudié de notre côté. Tout alléchante qu'elle soit, cette idée se heurte chez nous à un obstacle : La nécessité technique de faire rentrer les documents numérisés dans notre chaîne de migration : comme il y a d'ailleurs un souci de conservation des documents numériques sur une longue durée, Nous sommes particulièrement vigilants sur la rédaction des métadonnées, dont les spécifications dépassent certainement dans la plupart des cas les compétances des particuliers. Vous remerciant vivement de l'attention que vous portez à Gallica Xxxx [...] Service pôles associés-Gallica Autrement dit : vous savez pas faire l'étiquette, vous allez pas nous proposer de remplacer notre piquette par du bon vin... Bon, ya du boulot... Last edited by YGG-; 05-31-2009 at 01:16 PM. |
![]() |
![]() |
![]() |
#2 |
zeldinha zippy zeldissima
![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Posts: 27,827
Karma: 921169
Join Date: Dec 2007
Location: Paris, France
Device: eb1150 & is that a nook in her pocket, or she just happy to see you?
|
arg !!!! c'est grave.
![]() tu devrais répondre en précisant que tu leur fournis le texte, mais qu'ils sont libre ensuite de rajouter les méta-données et le classer à leur gré... ne serait-ce que pour voir ce qu'ils répondent ! |
![]() |
![]() |
![]() |
#3 |
Wizard
![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Posts: 2,625
Karma: 3120635
Join Date: Jan 2009
Device: Kindle PW3 (wifi)
|
moi, c'est pas vrai, j'ai rien dit d'abord
![]() "proposition étudié(e)" "compétance" ...bien, bien... Last edited by roger64; 05-30-2009 at 10:40 AM. |
![]() |
![]() |
![]() |
#4 |
Wizard
![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Posts: 2,625
Karma: 3120635
Join Date: Jan 2009
Device: Kindle PW3 (wifi)
|
Voilà à quoi ressemble une "notice complète" avec les méta-données suivantes:
Titre : Oeuvres complètes de Chateaubriand. 7, De Buonaparte et des Bourbons / [Chateaubriand] Auteur : Chateaubriand, François-René de (1768-1848)Ne voir que les résultats de cet auteur Éditeur : Acamédia (Paris) Date d'édition : 1861 Type : monographie imprimée Langue : Français Format : text/html Droits : domaine public Identifiant : http://gallica2.bnf.fr/ark:/12148/bpt6k1013749 Source : Bibliothèque nationale de France Relation : http://catalogue.bnf.fr/ark:/12148/c...0z/description Provenance : Bibliothèque nationale de France Mode texte disponible Thématique : Littérature francophone Fermer la notice complète |
![]() |
![]() |
![]() |
#5 |
zeldinha zippy zeldissima
![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Posts: 27,827
Karma: 921169
Join Date: Dec 2007
Location: Paris, France
Device: eb1150 & is that a nook in her pocket, or she just happy to see you?
|
ha oui, ben je comprends mieux qu'ils refusent. ça recèle des trésors d'érudition et de complexité, cette notice, sûrement bien hors de la portée de nous autres, pôv' mortels...
![]() |
![]() |
![]() |
![]() |
#6 |
Dry fruit
![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Posts: 1,157
Karma: 1047086
Join Date: Dec 2008
Location: Paris, France
Device: Bookeen Opus + HTC Desire HD
|
Je note que le nom du signataire et je ricane (c'est mal, je sais) : le traître!
![]() (je n'ai pas souligné les fautes d'orthographe; charité quand tu nous tiens...) Last edited by YGG-; 05-31-2009 at 01:17 PM. |
![]() |
![]() |
![]() |
#7 |
Wizard
![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Posts: 2,625
Karma: 3120635
Join Date: Jan 2009
Device: Kindle PW3 (wifi)
|
Je viens de regarder à l'instant chez Gallica la version texte de "Les Dieux ont soif" . Elle me parait d'excellente qualité alors qu'ils affichent toujours un taux de reconnaissance "officiel" de 98%. Le taux réel me parait nettement supérieur à première vue et, en tout cas, immédiatement lisible.
Une comparaison avec le premier texte frais émoulu de l'OCR que tu as "nettoyé" pour ton édition FeedBooks serait sans doute intéressante. N'y a t-il pas eu une mise à jour discrète? Qu'en penses-tu? Bizarre... ![]() PS: tu devrais supprimer les noms propres. On parle de Gallica. Last edited by roger64; 05-30-2009 at 03:41 PM. |
![]() |
![]() |
![]() |
#8 | ||
Dry fruit
![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Posts: 1,157
Karma: 1047086
Join Date: Dec 2008
Location: Paris, France
Device: Bookeen Opus + HTC Desire HD
|
Quote:
Quote:
|
||
![]() |
![]() |
![]() |
#9 |
Guru
![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Posts: 748
Karma: 3000
Join Date: May 2009
Device: PRS-505, PRS-600, PRS-650
|
Est-ce que ça ne pourrait pas aussi plus simplement être du au manque de temps pour vérifier que par exemple, tu n'as pas, petit garnement que tu es !, ajouté une phrase bidon au livre ?
|
![]() |
![]() |
![]() |
#10 |
Dry fruit
![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Posts: 1,157
Karma: 1047086
Join Date: Dec 2008
Location: Paris, France
Device: Bookeen Opus + HTC Desire HD
|
Bonne hypothèse, positive, va savoir! Sauf que les logiciels de comparaison (chasse au plagiat) existent bel et bien... Mais bon j'achète...
|
![]() |
![]() |
![]() |
#11 |
zeldinha zippy zeldissima
![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Posts: 27,827
Karma: 921169
Join Date: Dec 2007
Location: Paris, France
Device: eb1150 & is that a nook in her pocket, or she just happy to see you?
|
c'est vrai que tu es un petit garnement...
![]() |
![]() |
![]() |
![]() |
#12 |
I eat books
![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Posts: 601
Karma: 5124
Join Date: Jun 2009
Location: Milan, Italy
Device: Gen3 PRS-505 PRS-600 PB360 PB302 K2 Opus BebookMini OnyxBoox K3 KDXG
|
|
![]() |
![]() |
![]() |
#13 |
High Priestess
![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Posts: 5,761
Karma: 5042529
Join Date: Jul 2008
Location: Montreuil sous bois, France
Device: iPad Pro 9.7, iPhone 6 Plus
|
C'est marrant, je lisais justement l'autre jour un article de language log sur la qualité des métadonnées de Google - exécrable apparemment !
|
![]() |
![]() |
![]() |
#14 |
a pthread?? where? where?
![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Posts: 1,763
Karma: 30462
Join Date: Mar 2009
Location: Somewhere in EU
Device: Newton MessagePad 2100, and only this
|
Et si il n'y avais que les metadonnées ...
|
![]() |
![]() |
![]() |
#15 |
High Priestess
![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Posts: 5,761
Karma: 5042529
Join Date: Jul 2008
Location: Montreuil sous bois, France
Device: iPad Pro 9.7, iPhone 6 Plus
|
Mais il paraît aussi qu'ils s'améliorent
![]() |
![]() |
![]() |
![]() |
|
![]() |
||||
Thread | Thread Starter | Forum | Replies | Last Post |
Historical Fiction Hugo, Victor: Notre-Dame de Paris [The Hunchback of Notre Dame] LIT v2, 23 Nov 2009 | Patricia | Other Books | 0 | 11-22-2009 09:54 PM |
Historical Fiction Hugo, Victor: Notre Dame de Paris [Hunchback of Notre Dame], v.2, 29 July 2008 | Patricia | IMP Books | 1 | 11-22-2009 09:41 PM |
Historical Fiction Hugo, Victor: Notre Dame de Paris [Hunchback of Notre Dame], v.2, 29 July 2008 | Patricia | BBeB/LRF Books | 1 | 11-22-2009 09:33 PM |
Historical Fiction Hugo, Victor: Notre Dame de Paris [Hunchback of Notre Dame], v.2, 29 July 2008 | Patricia | Kindle Books | 2 | 11-22-2009 09:21 PM |
Et les textes de Gallica ? | porcorosso | E-Books | 2 | 10-11-2008 01:06 AM |