View Single Post
Old 11-17-2009, 02:59 PM   #22
cidrolin
Enthusiast
cidrolin began at the beginning.
 
Posts: 28
Karma: 48
Join Date: Oct 2009
Device: none
Quote:
Originally Posted by zelda_pinwheel View Post
d'après ce que j'ai compris, l'idée de hadrien serait de se baser sur les balises dd, di (etc.) qui d'ailleurs sont faites pour ça (dd = "dictionary definition"). tout n'est pas encore validé mais je pense que si tu te bases sur ce schéma, ça devrait permettre (au pire) de facilement adapter ton xml à la solution retenue, même si elle est légèrement différente... espérons qu'on en saura plus très rapidement !
pour l'instant, rien compris à à ces balises, mais j'y travaille.

Ça marche bien si il y a une clef par entrée, par exemple :

Code:
<dl>
<di>
<dt>Concorde</dt>
<dd><gram>s. f.</gram> Union de coeurs & de volontez, bonne intelligence entre des personnes. La concorde est une chose rare entre 
des fréres. entretenir, maintenir la concorde. ils vivent dans une grande
 concorde, dans une parfaite concorde. cela pourroit altérer la concorde qui est entre eux</dd>
</di>
</dl>
La, OK.

Mais pour une entrée plus complexe (plusieurs clefs pour une seule entrée en résumé) :



Quote:
Dictionnaire de l'Académie française, 1st Edition (1694)
BALDACHIN. s. m. On prononce Baldaquin. Dais qu'on porte sur le saint Sacrement, ou sur la teste du Pape dans les processions.

Jean-François Féraud: Dictionaire critique de la langue française (1787-88)
baldachin

BALDACHIN, ou BALDAQUIN, s. m. [Balda-kein, tout bref; le 1er désigne mieux l'étymologie italiène, (Baldacchino) et le 2d, la prononciat. C'est le seul que mette l'Académie, et qui soit de l'usage actuel.] — 1°. Ouvrage d'Architectûre, orné de colonnes, qui sert à environer et à couvrir l'Autel d' une Église. = 2°. Dais qu'on porte sur le S. Sacrement dans les Processions. = 3°. On dit aussi baldaquin d'un catafalque, et lit à baldaquin.

Avec les DT, galère :


Code:
<dl>
<di>
<dt>Baldachin</dt>
<dd>certains écrivent baldaquin<gram>s. m.</gram> bla bla bla</dd>
</di>
</dl>
en rouge, on une deuxième clef d'entrée... En gros, mon XML pour répondre à ce cas de figure courant pour les dicos anciens fait comme cela :



Code:
<entry>
<entryname>Baldachin</entryname>, certains écrivent
<entryname>baldaquin</entryname>. <gram>s. m.</gram> bla bla
bla bla
</entry>

Je suis bien embêté : il y aura souvent plusieurs termes à mettre dans le dt, sinon il manquera des entrées à l'index,et il est explicitement dit que un dt ne comporte qu'un terme.


Ou alors
(mais ça va augmenter la taille du dico) :


Code:
<dl>
<di>
<dt>Baldachin</dt>
<dd>Baldachin certains écrivent baldaquin<gram>s. m.</gram> bla bla bla</dd>
</di>
<di>
<dt>Baldaquin</dt>
<dd>Baldachin certains écrivent baldaquin<gram>s. m.</gram> bla bla bla</dd>
</di>
</dl>



*************



Quote:
Originally Posted by zelda_pinwheel View Post
(tu bosses bien sur le dico de l'Académie, 8ème édition, oui ?). du coup je me dis ça sert pas à grand chose que je le reprenne, j'attendrai plutôt ton xml bien propre si tu veux bien partager !
Hélas ! je suis sur le DAF1 (parce que c'est le premier). Ensuite DAF5 (celui de la révolution française, assez drôle), puis DAF8 (le dernier complet). Est-ce que le DAF9 est dans le domaine publique ? Faut que je cherche.

Le Littré ensuite. Puis quelques autres, une fois que le process sera mis en place, ça sera plus rapide (et une fois que j'aurais fini de bosser pour l'agreg aussi, j'aurai plus de temps).


Quote:
Originally Posted by zelda_pinwheel View Post
tiens, juste un détail que j'avais oublié l'autre fois, je vois que tu reportes l'alphabet en haut de la page, mais dans l'ordre d'un clavier d'ordinateur... pourquoi ce choix ?
Héhé... Il était 3 heures du mat, et je ne savais plus générer en python une chaine de caractère... donc j'ai fait glisser mon index le long du clavier. Bouh ! c'est pas beau, mais parfois !
cidrolin is offline   Reply With Quote