#Version 1.9
#
#Fichier de commentaires apparaissant en info-bulle pour chaque regex
#
#Le # commente la ligne : celle-ci n'est pas traitée
#Pour chaque regex le format est :
#
#[numero de regex]
#nom de l'icône (SANS EXTENSION). Les icônes disponibles sont dans le dossier resources de l'archive typex.zip
#commentaire : texte ou html. En format texte les sauts de lignes sont repris, en html il faut rajouter <br/>
#
#Exemples :
#
#[16]
#book
#<b>commentaires 16</b><br/>
#et la suite

#[18]
#book
#<h3>comm du 18</h3>

#[06]
#idea
#<p>Une liste :
#<ul>
#<li>bla
#<li>bla
#<li>bla
#</ul></p>

#[07]
#Ou du
#texte brut

[05]
book
<b>Paire de quotes ou d’apostr. encadrées par des esp. (-> paire de quotes anglaises)</b>
<p>Prenons l’ex. : « L’attribut 'lang' définit la langue ».</p>
<p>Dans ces cas (rares) de chaîne encadrée par des quotes simples, la règle 06 va changer la seule 2e quote en apostr., ce qui donne un résultat déséquilibré et particulièrement inesthétique : « L’attribut 'lang’ définit la langue ».</p>
<p>Par une manœuvre hasardeuse, les quotes ont peut-être déjà été remplacées systématiquement par des apostr. typo : « L’attribut ’lang’ définit la langue ».</p>
<p>Cette règle a pour objectif de remplacer une paire de quotes droites ou d’apostr. typo par une paire de quotes courbes (quotes anglaises) à condition que la paire initiale soit elle-même encadrée par des esp. (ou des parenthèses, ou précédée par une balise ou suivie par un point ou une virg.). Résultat : « L’attribut ‘lang’ définit la langue. ».</p>
<p>La règle ne remplace pas à l’intérieur des styles embarqués, des commentaires et des balises.</p>

[06]
book
<b>Apostr. dactylo après une lettre ou apostr. manquante (-> apostr. typo)</b>
<p>La règle sélectionne l’apostr. dactylo au milieu ou à la fin d’un mot. Elle doit être précédée par une lettre, et suivie par une lettre, une esp. ou un car. parmi “<«”.
<ul>
<li>“<” prend en compte le cas où le mot qui suit l’apostr. est en italique, et donc est séparée d’elle par une balise (ex. : l'<balise>éternité</balise>) ;
<li>“«” prend en compte le cas où le mot qui suit l’apostr. est entre guillemets (ex. : l'« éternité »).
</ul></p>
<p>Dans les expressions anglaises telles que <i>Jumpin' Jack Flash</i> ou <i>Reader's Digest</i>, les codes typo. anglo-saxons recommandent l’usage de l’apostr. typo. Ces cas sont aussi pris en compte par cette règle.</p>
<p>La règle ne remplace pas à l’intérieur des styles embarqués et des balises.</p>
<p>En outre, dans le cas d’une lettre parmi  “cdjlmnst” ou “qu”, suivi d’une balise puis d’une apostr. droite ou courbe puis d’une voyelle, la règle inverse la balise et l’apostr. Si l’apostr. est droite, elle est remplacée par une apostr. courbe.</p>
[07]
book
<b>Esp. et/ou apostr. dans c' d' j' l' m' n' s' t' qu' (-> apostr. typo sans esp.)</b><br/>
<b>[Respecter la casse] est cochée</b>
<p>L’objectif principal de la règle est de remplacer une quote droite par une apostr. typo tout en supprimant une éventuelle esp. excédentaire à côté de la quote.</p>
<p>Lorsqu’une espace figure à côté de l’apostr., il peut s’agir d’une apostr. en début ou en fin de mot. Il ne faut alors pas supprimer l’esp. C’est la raison pour laquelle nous restreignons la recherche aux lettres qui précèdent et suivent une apostr. en français :</p>
<p>Si l’apostr. (droite ou courbe) est précédée ou suivie par une esp. et si ces 2 car. sont précédés par une lettre parmi “cdjlmnst” ou par “qu”, et suivis par une voyelle ou “h” (tous maj. ou min.), alors la règle place une apostr. typo sans esp. Ex : j' ai, quoiqu 'il.</p>
<p>En complément, la règle traite deux cas où seule l’esp. est présente (apostr. manquante). Dans les 2 cas, <b>la voyelle ou “h” doivent être en min.</b> :
<ul>
<li>“qu” en min., ou bien la lettre en min. parmi “cdjlmnst” précédée par une esp., une balise (sauf si cette balise est elle-même précédée par une majuscule, pour éviter les lettrines), un car. parmi “([-, ou encore par “aujour” ou “pru”. Ex : j ai, quoiqu il, aujourd hui, prud homme.<br/>
La chaîne “-t” suivi d'une espace puis de “il”, “elle” ou “on” est mise en exclusion, car l’espace devrait être remplacée par un tiret (voir règle 56).
<li>“Qu” ou la lettre en maj. parmi “CDJLMNST” sont précédées d’une balise <i>p</i> ou <i>div</i> ou d’une ponct. suivie d’une espace.
</ul></p>
<p>La règle remplace l’esp. par une apostr. typo.</p>
<p>Cependant, la règle ne sélectionne pas le cas où “m” est suivi d’une espace et précédé d’un chiffre suivi d’une espace (ex. : il marche 330 m et s’arrête).</p>
<p><b>Remarque :</b> dans les cas de l’apostr. manquante ou précédée d’une esp. excédentaire, les mots aujourd, prud et presqu sont détectés par la vérif. d’orthographe.</p>

[09]
book
<b>[F] 2 quotes simples, courbes ou droites (-> double quote)</b><br/>
<b>La fonction <i>2quotes_simples</i> est mise en oeuvre</b>
<p>Ce sont des cas probablement rares, mais c’est déjà arrivé. Le guillemet prenait 2 caractères. Cette règle permet de remplacer ces doublettes par le caractère correspondant. Les guillemets anglais seront remplacés par les guillemets français par la règle 2G.</p>
<p>La façon d’obtenir des guillemets au clavier est indiquée dans le Guide.docx.</p>
#<p><img src="resources/guillemets.png" alt="Guillemets au clavier"></p>
<p>Dans l’éditeur de Calibre, voir aussi les favoris dans le menu <i>Éditer/Insérer un caractère spécial</i>, ou cliquer sur l’icône correspondante dans la barre du haut.</p>

[0E]
book
<b>[S][F] Quote + guillemet angl. simple (-> paire de guillemets angl. simples)</b><br/>
<b>La fonction <i>Quote_guillemet_simple</i> est mise en oeuvre</b>
<p>Cette règle examine le cas rare où, dans une paire de guillemets angl. simples, un des guillemets aurait été remplacé par une quote. Elle est remplacée par le guillemet angl. simple correspondant.</p>
<p><b>Remarque :</b> Dans une transcription latine d’un mot arabe (un nom propre, par ex.), le mot peut commencer par un guillemet anglais gauche simple. On peut imagine que l’OCR transforme ce guillemet simple en quote. Elle ne sera pas sélectionnée en raison de l’absence du guillemet fermant.</p>

[12]
book
<b>Balises i etc. vides ou ne contenant que point, virg., cadratin ou esp. ou <a></a> (-> suppr)</b>
<p>Les paires de balises <i>i</i>, <i>em</i>, <i>b</i>, <i>strong</i>, <i>span</i>, <i>small</i>, <i>sup</i> et <i>sub<i> sont supprimées si elles ne contiennent que des points, des virgules, des tirets cadratins ou des espaces, séc. ou inséc. Les éventuels car. contenus entre la paire de balises sont conservés.</p>
<p>Une balise <i>span</i> n’est pas sélectionnée si elle possède l’attribut <i>id</i>.</p>
<p>Une paire de balises <a> ne contenant aucun car., ou une balise <a/> autofermante sont également supprimées.</p>
<p>La cohérence avec les règles suivantes voudrait que l’on ajoute les guillemets français et les parenthèses dans la liste des caractères entre les balises. Le cas ne s’étant pas encore présenté, nous ne l’avons pas fait.</p>

[14]
star
<b>Sortir la virg. ou le point de la fin des ital. du gras ou du span</b><br/>
<b>Prérequis : règle 11</b>
<p>La règle prend en charge le contenu des balises <i>i</i>, <i>em</i>, <i>b</i> et <i>strong</i>, qui, par nature, ne s'imbriquent pas. Le <i>span</i> est plus délicat à prendre en compte car les balises <i>span</i> peuvent s'enchâsser. Il ne faudrait pas tester le début du premier <i>span</i> en liaison avec la fin du deuxième <i>span</i>… <b>Pour ces balises <i>span</i>, la règle prend en charge le contenu le plus imbriqué, le plus central</b>. Elle est complétée par la règle 16, laquelle prend en charge le contenu de la balise <i>span</i> la moins imbriquée, la première du paragr., jusqu'au dernier <i></span</i> du paragr.</p>
<p>Le cas où le point ou la virgule sont suivis d’une espace à la fin de la chaîne est pris en compte, empiétant sur la règle suivante. Ce ne sera pas possible pour la règle 16, qui reste donc dépendante de la règle 15.</p>
<p>Si l’italique, le gras ou le span s'appliquent à la ligne entière (ou au paragr.), la règle ne sort pas la ponct. de la chaîne, dont elle est partie intégrante. Ce serait l’ex. d’un vers de poème, ou de paroles de chansons. Le cas où la ligne se termine par une balise <i>br</i> est pris en compte.</p>
<p>Si l’italique, le gras ou le span s'appliquent à une phrase, la règle ne sort pas la ponct. de la fin de la phrase. De même, si la chaîne se termine par une des abréviations suivantes : « etc. », « ibid. », « Ibid. », « id. » ou « Id. ».</p>
<p><b>En résumé</b>, il y a sélection du contenu (pour remplacement) si :
<ul>
<li>le contenu occupe le paragraphe entier ou la ligne
<li>la balise ouvrante n'est pas précédée d'une espace (sécable ou non) elle-même précédée de l'une des ponct. suivantes : [–—)>«»”"?.!…;:]
<li>la balise ouvrante n'est pas précédée de l'une des ponct. suivantes : [("“]
<li>la sélection ne contient pas un point
<li>la balise fermante est précédée d'une virgule ou d'un point (suivis éventuellement par une espace).
</ul></p>

[1C]
star
<b>Sortir la parenthèse ou les guillemets fermants de la fin d’ital. ou de span</b><br/>
<b>Prérequis : règles 11 & 15</b>
<p>L’objectif de la règle est de déplacer une parenthèse ou des guillemets fr fermants collés intérieurement à la balise fermante d’une paire de balises <i>i, em</i> ou <i>span</i>.</p>
<p>La regex ne sort la ponct. fermante que si la ponct. ouvrante est à l’extérieure de la paire de balises ou est collée intérieurement à la balise ouvrante. Dans ce dernier cas, la règle 1D, qui sort la ponct. ouvrante, doit être exécutée.</p>
<p>Dans le cas des guillemets, l’inséc. ou la séc. qui précèdent éventuellement sont également déplacées.</p>
<p>Dans le cas de span enchâssés, seule la paire de balises qui ne contient aucune autre paire de <i>span</i> est traitée.</p>

[1E]
book
<b>Ouverture d'italique placée avant un article élidé en min.</b><br/>
<b>[Respecter la casse] est cochée</b>
<p>Lorsqu’une balise d’ouverture d’italique précède un article élidé en min. suivi de l’apostrophe puis d’une maj., la règle déplace la balise avant la maj. Ex. :</p>
<p>< i class="ital">l’Intrépide< /i> -> l’< i class="ital">Intrépide< /i></p>
<p>mais < i class="ital">L’Avare< /i> n’est pas sélectionné (« L » maj.)</p>
<p>Cette règle est une aide pour parcourir les occurrences, en aucun cas une obligation à appliquer aveuglément. À l’utilisateur de juger ce qu’il convient de faire.</p>
<p><b>Rappel :</b> Le déplacement de la balise d’ouverture d’italique lorsque celle-ci précède directement l’apostrophe est effectué par la règle 06.</p>

[1F]
book
<b>Balise de n° de page (-> fin du mot ou du nombre coupés)</b>
<p>Les epubs comm. ont souvent un système de marquage du n° de page par une balise « a id="pg_nn" » qui peut parfois couper un mot ou un nombre en deux. C’est gênant pour la vérif. d’orthographe et les fonctions qui appellent le dictionnaire. Les balises ouvrantes et fermantes (ou auto-fermantes) n’encadrent pas de texte et peuvent donc être déplacées à la fin du mot coupé sans inconvénient. C’est l’objectif de cette règle qui élargit ce principe à toute balise “a” ou “span” sans texte contenu. Le cas des balises auto-fermantes n’est pas pris en compte par la règle actuelle.</p>
<p>La syntaxe du mot comprend les chiffres, l’insécable et le tiret, plus le point et la virgule pour la 2<sup>e</sup> partie du mot coupé. Ainsi, la pagination à l’intérieur d’un chiffre avec virgule, et séparation des milliers par une inséc. sera reportée à la fin complète du chiffre. De même, si un nom avec middle name comme George W. Bush comporte une insécable après George, la pagination sera reportée après le point de W.</p>

[22]
book
<b>[F] Double quote suivie ou précédée par un car. alphanum. (-> guillemet angl.)</b><br/>
<b>La fonction <i>Double quote</i> est mise en oeuvre</b>
<p>L’objectif de la règle est de remplacer une double quote (« " ») par un guillemet anglais ouvrant si elle est suivie par un car. alphanum., et par un guillemet anglais fermant si elle est précédée par un car. alphanum. ou une ponct.</p>
<p>Le cas où une balise s’interpose entre la double quote et le caractère alphanum. (ou la ponct.) est pris en compte.</p>
<p>La règle ne sélectionne pas à l’intérieur des balises.</p>
<p>Si vous le souhaitez, les guillemets anglais pourront ensuite être remplacés par des guillemets français par la règle 2G.</p>

[23]
star
<b>[S] Paires de double quotes encadrées par des espaces (->guillemets angl.)</b><br/>
<b>[Le point correspond à tout] est cochée</b><br/>
<b>[Pas à pas] obligatoire</b><br/>
<b>Prérequis : règle 22</b>
<p>Après la règle précédente, il ne devrait plus rester de double quotes. S’il en reste, elles sont encadrées par des espaces (ou suivies par une ponct. dans certains cas), bien que ce soit contraire aux règles de typo. Cette règle se place dans cette hypothèse, en supposant qu’elle a été appliquée de façon un peu systématique dans l’epub. La sélection des doubles quotes par paires, afin d’affecter les guillemets ouvrants et fermants repose sur cette dernière supposition. Sinon, la règle n’arrivera pas à appareiller 2 doubles quotes restantes.</p>
<p>Le cas où une balise s’interpose entre la double quote et l’espace (ou la ponct.) est pris en compte.</p>
<p>La double quote « fermante » n’est obligatoirement ni précédée ni suivie par une espace (cas où elle est précédée ou suivie par une ponct., ou suivie par une balise).</p>
<p>La règle ne sélectionne pas à l’intérieur des balises.</p>

[28]
book
<b>(-> inséc.) avant une ponct. parmi ;:»?!</b>
<p>L’objectif de la règle est de placer une inséc. avant les ponct. doubles (à savoir ;:?!) et les guillemets fermants, sauf si elle y figure déjà (ce qui permet d’avoir le bon nombre au comptage). Elle place aussi une inséc. avant « etc » pour éviter le renvoi à la ligne.</p>
<p>La règle ne sélectionne pas lorsque la ponct. est déjà précédée d’une inséc même si une ou plusieurs balises sont placées entre les deux, ni si la ponct. est située à l’intérieur d’un lien.</p>
<p>La règle ne sélectionne pas non plus si les répétitions de ponct. doubles (telles ??, !! ou ?!) sont déjà précédées d’une inséc., ou si la phrase commence par ¿ ou ¡. En effet, dans la typographie espagnole, les points d’interrogation ou de d’exclamation ne doivent pas être précédés d’une inséc.. Il arrive de trouver de telles phrases dans un livre en français, y compris dans les bibliographies.</p>
<p>La règle évite de traiter les deux points quand une heure est donnée sous la forme 09:15, et de traiter le point-virgule appartenant aux entités &amp;, &lt; ou &gt;. Elle évite enfin de traiter le point d’exclamation ou d’interrogation dans les chaînes comme (!) ou (?). Les répétitions de ponct. (telles ??, !! ou ?!) sont sélectionnées comme un tout.</p>
<p>La regex ignore le texte contenu dans les balises et les styles embarqués dans le fichier.</p>
<p>La règle précédente n’est pas notée comme prérequis, mais ne pas l’exécuter a cette conséquence : si l’epub a des guillemets de suite qui sont le car. "»" en début de paragraphe, ces guillemets seront probablement sélectionnés par la présente règle.</p>
<p>Si le livre contient une factorielle (ex : factorielle de n, notée n!), il faudra en tenir compte manuellement, car la regex ajoutera une insécable avant le point d’exclamation. De même dans une expression comme : (n – 1)!</p>

[29]
book
<b>Espace après guillemets ouvrants (-> inséc.)</b>
<p>L’objectif de la règle est de placer une inséc. après les guillemets ouvrants, sauf si elle y figure déjà (ce qui permet d’avoir le bon nombre au comptage).</p>
<p>La regex envisage les cas où le guillemet ouvrant est collé au texte qui suit, ou séparé par une des combinaisons de sécable, de balise et d’inséc.</p>

[2I]
star
<b>[C][S] Parenthèse manquante</b><br/>
<b>Prérequis : règle 2H</b>
<p>La regex suppose que, pour indiquer une parenthèse à l’intérieur d’une autre parenthèse, une ponctuation différente, telle que les crochets, est utilisée. Dans le cas contraire, la regex sélectionne une chaîne, même si les paires sont correctement constituées. <b>La règle 2H est donc un prérequis</b>.</p>
<p>La règle n’agit qu’à l’intérieur d’un paragraphe. Elle recherche d’abord, pour les exclure :
<ul>
<li>les paires de parenthèses correctement composées,
<li>les paragraphes commençant par une énumération, comme 1), 2), etc.
</ul></p>
<p>Le cas de la parenthèse ouvrante manquante, puis le cas de la parenthèse fermante manquante, sont ensuite traités.</p>

[35]
book
<b>[F] 3 points (ou virgules) (-> points de susp.)</b><br/>
<b>[Respecter la casse] est cochée</b><br/>
<b>La fonction <i>3 points</i> est mise en oeuvre</b>
<p>La règle sélectionne n’importe quelle combinaison de 3 points ou virgules (l'OCR a remplacé un ou plusieurs points par une virgule).</p>
<p>Les 3 points ne peuvent pas être précédés ou suivis par un point (sauf 2 exceptions plus bas), et doivent être suivis par une espace, sécable ou pas, un délimiteur de balise, une virgule, un slash, ou encore par : un guillemet anglais, une parenthèse ou un crochet fermants). 3 points directement suivis par une lettre ne seront donc pas sélectionnés, mais le seront par la règle suivante.</p>
<p>Les 3 points peuvent être séparés par une espace qui sera supprimée par le remplacement.</p>
<p>4 points dont le 1<sup>er</sup> est la fin d’un sigle, ou le caractère points de suspension et un point, ou une virgule puis le car. points de suspension, seront remplacés par un point et le car. points de suspension.</p>
<p>Les diverses combinaisons de « etc » suivi par 4 points ou par le car. points de suspension et un point, ou une virgule puis le car. points de suspension, séparés ou pas par une espace, sont remplacés par « etc. ».</p>

[36]
book
<b>[S] 4 car. max. parmi le point, la virgule et les points de susp. (-> points de susp. ?)</b><br/>
<b>[Respecter la casse] est cochée</b>
<p>La règle sélectionne :
<ul>
<li>4 points successifs.
<li>3 points successifs s’ils sont suivis par une lettre (ce cas n’est pas sélectionné par la règle 35 automatique parce qu’il doit être jugé en pas à pas).
<li>Toute doublette de points et/ou de virgules. Elle ne doit pas être suivie par un slash pour éviter de sélectionner un lien, par ex. la référence à une image telle que : href="../image/cover.jpg". La doublette ne peut pas être précédée ou suivie par un point ou une virgule, et doit être suivie par une espace, sécable ou pas, un délimiteur de balise, ou encore par : un guillemet anglais, une parenthèse ou un crochet fermants. Une sécable facultative peut séparer les 2 membres de la doublette, elle sera supprimée par défaut.
<li>Le car. points de suspension suivi par un point.
<li>Le point  suivi par le car. points de suspension sauf si ce point termine un sigle.
<li>La virgule suivie par le car. points de suspension.
</ul></p>
<p><b>La règle est limitée à 4 points successifs :</b> elle ne sélectionne pas dans une ligne de points de conduite dans un tableau, ou une ligne de séparation constituée de points. L’exécution en pas à pas est forcée, l’utilisateur doit juger au cas par cas ce qu’il convient de faire. <b>Par défaut, la règle remplace par le caractère points de suspension.</b></p>

[40]
book
<b>[F] Espace après le point</b><br/>
<b>[Respecter la casse] est cochée</b><br/>
<b>La fonction <i>Espace après point</i> est mise en oeuvre</b>
<p>Le point doit être suivi d’une espace, sauf en fin de paragraphe. La règle ne traite pas le contenu des balises.</p>
<p><b>Le point doit être précédé par 2 lettres</b>. Cette condition élimine les sigles, les dates [14.07.1789] et les cas où le point sert de séparateur [n° de téléphone]. Les cas d’une maj. unique suivie d’un point et d’une inséc. (comme M. Dupont, mais aussi tous les cas où le prénom est réduit à son initiale) et les abréviations courtes où le point est suivi d'un tiret (J.-C.) sont également éliminés par cette condition.</p>
<p><b>Le point ne doit pas être suivi</b> d’une espace ou d’une inséc. (des exceptions sont traitées plus bas), d’un retour ligne (cas où l’on a <i>/div</i> ligne suivante), d’une virgule (exemple : etc.,), d’un chiffre, d’une minuscule (évite de traiter les liens), d’un guillemet anglais fermant, d’une parenthèse fermante, d’un crochet fermant, d’un tiret sécable ou pas, ou de < (qui marque le début d’une balise, cela permet de ne pas ajouter d’espace en fin de paragraphe).</p>
<p>La règle traite un <b>cas particulier</b> en remplaçant une séc. par une inséc. entre av. et J.-C. ou entre ap. (ou apr.) et J.-C.</p>

[41]
book
<b>Espace après la virgule (sauf nbres)</b>
<p>La virgule doit être suivie d’une espace (éventuellement des points de suspension), sauf dans les nombres, avant un retour ligne et en fin de paragraphe (théâtre en vers, poésie ou chanson). Les espaces en fin de paragraphe seront traités par la règle 62.</p>
<p>Si la virgule est suivie d’une inséc. (sauf si cette inséc. est elle-même suivie par des guillemets fr fermants ou un demi-cadratin) ou de n’importe quel muliple d’inséc. et de séc., une seule séc. est mise à la place.</p>
<p>Si la virgule est suivie par une balise, le remplacement tient aussi compte du caractère qui suit la balise.</p>

[42]
book
<b>[S] (-> espace) après une ponct. parmi ?!:;…</b>
<p>Les ponct. doubles et les points de suspension doivent être suivis d’une espace (ou d’une inséc. si ils sont suivis de guillemets français fermants), sauf en fin de paragraphe, avant une parenthèse fermante, les guillemets anglais fermants ou un crochet fermant, ni dans les liens, les balises ou les styles embarqués dans le fichier, ni après le point-virgule de l’entité html <i>&amp;</i>, ni enfin après les deux points quand une heure est donnée sous la forme 09:20.</p>
<p>On évite aussi de remettre une espace dans une succession de ponct. doubles (comme : ??).</p>

[43]
book
<b>Espaces avant le point, la virg. ou les points de susp. (-> suppr)</b><br/>
<b>[Le point correspond à tout] est cochée</b>
<p>Dans les cas du point et de la virgule, la règle supprime les espaces (séc. ou pas) et les tabulations qui précèdent la ponct., sauf si cette dernière est suivie par un chiffre (à cause des calibres d’armes à feu, comme Colt .45).</p>
<p>Dans le cas des points de suspension, la règle supprime une espace séc. qui précède la ponct., sauf si cette dernière est précédée par un tiret de dialogue ou des guillemets ouvrants.</p>
<p>C’est la règle 51 qui remplace l’espace séc. par une inséc. après le cadratin de dialogue, mais, comme cette règle n’est pas encore exécutée, on ne peut pas être certain qu’une inséc. sépare le cadratin (ou demi-cadratin) de dialogue des points de suspension qui suivent. C’est la raison pour laquelle la règle ne sélectionne pas si un cadratin ou un demi-cadratin précèdent l’espace séc.</p>
<p>La règle 29 a déjà remplacé l’espace séc. par une inséc. après les guillemets ouvrants. Ajouter les guillemets ouvrants à côté des tirets de dialogue permet d’éviter de considérer la règle 29 comme un prérequis sans que cela bouleverse la règle pour autant.</p>
<p>Enfin, ces points ne sont pas seulement de suspension, mais peuvent aussi marquer l'élision au début d'un mot : « On va pas se laisser …culer par les politiques ». C’est la raison pour laquelle on oblige le car. suivant à être une espace.</p>
<p>La règle ne sélectionne pas à l’intérieur des balises et avant la balise <i>body</i>.</p>

[44]
book
<b>[F] Espaces redondantes (-> 1 séc. ou inséc.)</b><br/>
<b>La fonction <i>Redundant_spaces</i> est mise en oeuvre</b>
<p>Cette étape n’a pas d’influence sur l’affichage du livre, et l’embellissement ne supprime pas pour vous les espaces redondantes dans le texte des paragraphes.</p>
<p>Lorsque toutes les espaces sont séc., la règle les remplace par une séc. Lorsqu’une inséc. figure parmi les espaces, la règle les remplace par une inséc.</p>
<p>La regex envisage le cas où les espaces consécutives sont séparées par une ou plusieurs balises, invisibles à l’affichage par la liseuse. Dans le cas où les espaces sont toutes séc., la règle remplace par une séc., située après les balises lorsque ces dernières existent. Dans le cas où une inséc. figure seulement avant les éventuelles balises, la règle remplace par une inséc. également avant les balises. Inversement, si une inséc. figure seulement après les éventuelles balises, la règle remplace par une inséc. également après les balises. Si une inséc. figure avant et après les balises, la règle remplace par une inséc. après les balises.</p>

[50]
book
<b>Tiret (pas cadratin) en début de paragr. (-> cadratin)</b>
<p>Le paragraphe est reconnu par une balise de type <i>p</i> ou <i>div</i>. Le tiret simple, le demi-cadratin ou le souligné est remplacé par un tiret cadratin suivi d’une insécable, avec suppression des éventuelles espaces avant le tiret. Des balises peuvent s’interposer entre la balise marquant le paragraphe et le tiret.</p>

[52]
book
<b>[F] Tiret collé ou décollé (-> collage, signe moins ou décollage)</b><br/>
<b>La fonction <i>Collage_tirets</i> est mise en oeuvre</b>
<p>La règle propose de trouver des traits d’union décollés d’un seul côté, des nombres négatifs et des demi-cadratins collés à la lettre qui suit. Il est fortement conseillé de vérifier ce qui a changé.
<ul>
<li><b>Espace avant ou après un trait d'union</b> -> suppression de l’espace.
</ul></p>
<p>Si vous avez fait la vérification d’orthographe, ces cas sont déjà traités, car la vérification sort les mots commençant ou finissant par un tiret. C’est assez fréquent, aussi cette branche est proposée au cas où…
<ul>
<li><b>Tiret simple ou cadratin ou demi collé au nombre qui suit</b> -> remplacement par le signe moins.
</ul></p>
<p>La regex ignore le cas peu vraisemblable où le tiret suivi d’un chiffre est placé au début d’un paragraphe (absence de l’espace avant, alors). Le cas où il est précédé d’une parenthèse est pris en compte, par ex. : (−20%).</p>
<p>Si une date figure dans le livre sous la forme 14-07-1789 (déconseillé), cette règle n’y touchera pas en raison du chiffre qui précède le tiret.
<ul>
<li><b>Demi-cadratin collé à la lettre qui suit ou qui précède</b> -> décollage avec une insécable.
</ul></p>


[53]
star
<b>Tiret ou cadratin encadré par des espaces (->demi-cadratin)</b>
<b>Prérequis : règles 50 et 51</b>
<p>L’objectif de la règle est de remplacer un tiret ou un cadratin encadré par des espaces, ou précédé par une espace et suivi par une virgule, par un demi-cadratin (cas des incises). Une balise peut séparer l’espace du cadratin, mais dans ce cas, la balise qui précède ne peut pas être de type p ou div (paragraphe).</p>
<p>Cette règle doit être exécutée en pas à pas, ou alors, en automatique, <b>il est impératif de vérifier ce qui a changé</b>. On peut en effet trouver des cas dans lesquels le changement d’interlocuteur (indiqué par un cadratin) se fait parfois à l’intérieur d’un même paragraphe. Le tiret doit alors rester cadratin.</p>
<p>On peut également avoir affaire à un calcul qui devra recevoir un signe moins comme par ex. : Prix HT = Prix TTC – TVA. <b>Il ne faut pas remplacer le tiret</b>, car, la regex qui se charge de mettre le signe moins (règle B2) ne prend pas le demi-cadratin en compte, justement pour éviter de sélectionner les incises.</p>

[56]
book
<b>Tiret manquant ou “-t-” redondant (-> tiret)</b>
<p>La règle vise à remettre un tiret manquant, notamment lorsque le verbe et son sujet sont inversés (le car. « _ » signifie une espace, le car. « ? » que le car. précédent est facultatif, [Ee] signifie soit “E” soit “e”, \ que la chaîne commence sur une rupture de mot) :
<ul>
<li>[eac]-t_(elle, il, on)
<li>[eac]_t-(elle, il, on)
<li>ait_(elle, il, on) sauf si commençant par ([cC]’étaitֲֲ, [cC]e serait, [çÇ]a serait, [cC]ela serait, en fait), ou suivi par un tiret, “_aussi”, “_ne”, “_n’”, “_se”, ou “_s’”, ou, dans le cas de “il”, sauf si suivi par “_y” (ex. : il y a). Lorsque, entre “ait” et le pronom se glisse un “-t-” redondant, la redondance est supprimée. Ex. : répétait-t-il -> répétait-il
<li>ons_nous sauf si précédé par “[nN]ous”, ou pas dans une phrase interrogative
<li>ez_vous sauf dans “[cC]hez vous” ou si précédé par “[vV]ous”, ou pas dans une phrase interrogative
<li>ent_(elles, ils) sauf si précédé par “m” (les adverbes), “prés”, “souv” ou suivi par un tiret, “_aussi”, “ne”, “n’”, “se”, ou “s’”
<li>\[Ee]st_ce sauf si précédé par “[qQ]ui”, “[qQ]uel”, ou pas dans une phrase interrogative
<li>\[pP]eut_être sauf si précédé par ([eE]lle, [iI]l, ne, [oO]n, que, qui, ça, ce) ou un mot en min. avec une initiale en maj.
<li>\(celles?, celui, ceux)_(ci, là) sauf si suivi par un tiret, “_aussi”, “_ne”, “_n’”, “_se”, ou “_s’”
<li>\pots?-devin, pots?-de vin, allers? retours?, amour? propre?, amuse (gueules?, bouches?), années? lumière, [aA]près demain, arrière (pays, pensées?, plans?, saison, train), assurance vie, attachés? cases?, attrape nigauds?, (au, ci) (dedans, dehors, delà, desso?us, devant), [cC]i (g[iî]t, jointe?), cerfs? volants?, [gG]rands? (chose, mères, parents?, pères?), ([pP]ar, [lL]à) desso?us, plates? formes?, [vV]is à-vis, [vV]is-à vis, pique niqu
</ul></p>

[57]
book
<b>Tiret (-> tiret inséc.)</b><br/>
<b>[Respecter la casse] est cochée</b><br/>
<b>[Le point correspond à tout] est cochée</b>
<p>L’objectif de la règle est de remplacer le tiret par un tiret inséc. (\u2011) :
<ul>
<li>Dans les abréviations J.-C. (quand elle est précédée de « avant » ou « après »), P.-S. et W.-C. Les règles actuelles recommandent de ne pas mettre de points dans les sigles (PS et WC), mais il arrive de les rencontrer dans des livres <i>old school</i>.
<li>Lorsque le tiret est utilisé comme séparateur dans les intervalles (exemple : 1914-1918), ou dans les dates (exemple : 14-07-1989). Lorsque les chiffres sont collés au tiret, cette règle le rend inséc., tandis que lorsque les chiffres sont séparés du tiret par une espace, la règle B2 le remplace par le signe moins.
</ul></p>
<p>La règle évite de sélectionner les n° ISBN ou ISSN, le contenu des balises, et ce qui précède la balise <body>.</p>

[58]
warning
<b>(-> esp. séc. intérieures & extérieures aux tirets d’incises)</b>
<p>Les 2 règles qui suivent sont liées. Elles excluent les 2 règles 5C et 5D qui mettent des inséc. intérieures aux tirets d’incises et des esp. séc. extérieures.</p>
[59]
book
<b>[F] Pas d’esp. ou inséc. avant tiret d’incise (-> séc.)</b><br/>
<b>La fonction <i>Incises1</i> est mise en oeuvre</b>
<p>Cette règle s’occupe de l’espace qui précéde indifféremment les tirets d’incise demi-cadratins ouvrants et fermants. En l’absence d’esp., ou s’il s’agit d’une inséc., elle place une séc.</p>
<p>Pour des raisons esthétiques, si le tiret est suivi par une ponct. (tiret fermant), on remplace la séc. qui le précède par une inséc., pour éviter que le tiret suivi de la ponct. soit renvoyé au début d’une nouvelle ligne.</p>
<p>Si le tiret est collé à une balise qui le précède, il n’est pas sélectionné, pour éviter le cas où le demi-cadratin figure le tiret de dialogue.</p>
[5A]
book
<b>Inséc. après tiret d’incise (-> sécable)</b>
<p>Cette règle place une esp. séc. après un tiret d’incise sauf s’il est suivi par une séc., une virgule ou par une inséc. elle-même suivie par une ponct. parmi “:;?!”. Une balise peut s’interposer entre le tiret et le car. qui le suit.</p>
<p>Si le tiret est collé à une balise qui le précède, il n’est pas sélectionné, pour éviter le cas où le demi-cadratin figure le tiret de dialogue.</p>
[5B]
warning
<b>(-> inséc. intérieures & séc. extérieures aux tirets d’incises)</b>
<p>Les 2 règles qui suivent sont liées. Elles excluent les 2 règles qui précèdent et qui mettent des esp. séc. intérieures et extérieures aux tirets d’incises.</p>
[5C]
book
<b>[F] Paire de tirets (-> inséc. intérieures)</b><br/>
<b>[Respecter la casse] est cochée</b><br/>
<b>La fonction <i>Incises2</i> est mise en oeuvre</b>
<p>Les car. contenus dans l’incise peuvent être tous les car. différents du tiret demi-cadratin. Les car. parmi “.?!…” sont permis s’ils sont suivis immédiatement par un chiffre (les calibres des armes à feu) ou par une esp. et une lettre min. En outre, le point est permis dans M., Mr., Mrs. et Ms, ainsi que dans les sigles et les liens (notamment les appels de note).</p>
<p>L’incise doit être suivie par une séc., une virg., une parenthèse fermante, ou bien une inséc. si cette dernière est suivie par une ponct. parmi “:;?!”.</p>
<p>La règle fait échouer 2 cas :
<ul>
<li>Le 1<sup>er</sup> tiret est immédiatement précédé d’une balise “p” ou div (le tiret de dialogue est un demi-cadratin).
<li>Une incise encadrée par une paire de tirets possédant déjà des inséc. intérieures et les car. extérieurs requis.
</ul></p>
<p>On évite ainsi le cas où le tiret de dialogue est un demi-cadratin et ceux où les deux incises répondent déjà à l’objectif de la règle.</p>
[5D]
book
<b>Tiret demi-cadratin isolé (-> inséc. après)</b><br/>
<b>[Respecter la casse] est cochée</b>
<p>La règle fait d’abord échouer 2 cas et passe à la suite :
<ul>
<li>Le 1<sup>er</sup> tiret est immédiatement précédé d’une balise “p” ou div (le tiret de dialogue est un demi-cadratin).
<li>Une incise encadrée par une paire de tirets, quelles que soient les esp. intérieures et extérieures de ces tirets. L’expression permettant de sélectionner l’incise est identique à celle de la règle précédente.
</ul></p>
<p>Les demi-cadratins restants sont considérés comme isolés. La règle met une séc. avant et une inséc. après le tiret si ce n’est pas déjà le cas.</p>

[60]
book
<b>Espace en début de paragr. (-> suppr)</b>
<p>La règle supprime une espace, séc. ou pas, ou une tabulation en début de paragraphe, c’est-à dire après une balise <i>p, blockquote, div, h1 à n</i>, ou <i>li</i>.</p>
<p>Elle évite de modifier un paragraphe ne contenant qu’une insécable.</p>
<p>Une balise peut s’intercaler entre la balise de pararaphe et l’espace à supprimer, mais cela ne peut pas être une balise br. C’est pour éviter de sélectionner un paragraphe comme :</p>
<p style="text-align: center;"><balise p><balise br/>{insec}<balise br/>{insec}<balise /p></p>
<p>Si on supprime l'insécable dans la ligne ci-dessus, certaines liseuses ne feront qu'un seul saut de ligne.</p>
<p>L’espace en début de paragraphe, avant un cadratin de dialogue, a déjà été réglé par la règle 51. Ce n’est pas un prérequis, le cas est à nouveau traité.</p>
[61]
book
<b>[S] Paragr. vides ou contenant seulement des espaces (-> inséc.)</b>
<p>Avant toute action si le comptage est positif, il est utile de se demander la raison de la présence de ces balises, qui sont sans effet sur l’affichage de l’epub. C’est la raison pour laquelle cette règle est en pas à pas obligatoire. Faut-il ajouter une inséc. ? ou supprimer la sélection ? La première solution est placée par défaut dans la zone <i>Remplacer</i>. Elle a pour effet de créer une ligne vide à l’affichage.</p>
[62]
book
<b>Espaces en queue de paragr. (-> suppr)</b>
<p>La règle supprime les espaces séc. ou inséc. en queue de paragraphe, avant la balise de fermeture du bloc, sauf si le paragraphe ne contient que des inséc. Les balises <i>blockquote, div, p, h1 à n, et li</i> sont prises en compte. D’autres balises éventuelles (<i>i, b</i> ou <i>span</i>) peuvent s’intercaler entre cette balise de fermeture et les espaces qui précèdent.</p>
<p>Les cas traités par la règle 61 ne sont pas sélectionnés par celle-ci, puisqu’elle a transformé les séc. en inséc. Si la règle 61 n’a pas été exécutée, les espaces séc. d’un paragraphe « vide » seront simplement supprimées par la règle 62, ce qui est sans effet sur l’affichage. La règle 61 n’est pas considérée comme un prérequis.</p>
[63]
book
<b>[S][F] Rupture paragr. intempestive</b><br/>
<b>[Respecter la casse] est cochée</b><br/>
<b>La fonction <i>Rupt_paragr</i> est mise en oeuvre</b>
<p>Le second paragraphe doit être du même type, <i>p</i> ou <i>div</i>, que le premier paragraphe.</p>
<p>La règle prend en compte deux cas :
<ul>
<li>Le premier paragraphe de la sélection se termine par une lettre min., un chiffre ou une virgule, éventuellement suivis par des guillemets fr ou angl. fermants, ou une parenthèse fermante, et enfin des balises fermantes. La règle raboute les deux paragraphes en plaçant si nécessaire une espace entre les mots et, dans le cas d’une séquence en italiques, en reconstituant la continuïté de la chaîne en italiques.
<li>Le premier paragraphe de la sélection se termine par un tiret. Il s’agit probablement d’un tiret de césure. Dans ce cas, le mot coupé est sûrement sorti dans la vérif. d’orthographe, et a déjà été corrigé. La règle raboute les deux paragraphes en conservant par défaut le tiret, sans espace.
</ul></p>
<p>Le second paragraphe de la sélection doit commencer par une min. Il y a un petit risque de faux positifs : poèmes, chansons, épigraphes…, mais la première lettre du second paragraphe est souvent en maj. Il faut avancer pas à pas dans la recherche, après le comptage, mais les cas sont peu fréquents.</p>
<p>Couplé à l’obligation d’un paragraphe de type <i>p</i> ou <i>div</i>, cela évite de sélectionner des titres ne se terminant pas par un point, tels que Chapitre II, ou des paragraphes entièrement en maj. dans le corps du texte, sans ponctuation finale.</p>
[64]
book
<b>[S] Paragr. sans ponct. finale (-> ponct.)</b><br/>
<b>[Respecter la casse] est cochée</b>
<p>Cette règle complète la règle 63 : paragraphe se terminant par une min. (mais, ici, pas par une virgule), tout en imposant que <b>le paragraphe suivant commence par une maj.</b> Au lieu d’une rupture de paragraphe intempestive, on a probablement affaire à une simple omission de la ponctuation finale.</p>
<p>Le remplacement par défaut ajoute un point final, ce qui est l’omission par l’OCR la plus probable. La ponctuation manquante peut aussi être les points de suspension, un point d’exclamation ou d’interrogation… C’est la raison pour laquelle il faut procéder pas à pas.</p>
<p>À la fin du premier paragraphe, après la min., on peut trouver des guillemets fr ou angl. ou une apostrophe fermants, et des balises fermantes.</p>
<p>Au début du second paragraphe, avant la maj., on peut trouver un cadratin ou un demi-cadratin, des guillemets fr ouvrants et des balises.</p>

[70]
star
<b>[S][F] Minuscule en début de paragr. (-> majuscule)</b><br/>
<b>[Respecter la casse] est cochée</b><br/>
<b>La fonction <i>Upper-case text (ignore tags)</i> est mise en oeuvre</b><br/>
<b>Prérequis : règle 51</b>
<p>Si le 1<sup>er</sup> car. d’un paragraphe est une min., la règle la remplace par une maj. sauf si ce car. fait partie d’une url.</p>
<p>Des balises ou bien un tiret (cadratin ou demi-cadratin) suivi d’une inséc. peuvent séparer le 1<sup>er</sup> car. de la balise marquant le paragraphe.</p>

[71]
book
<b>[S][F] Minuscule après un point (->Maj.)</b><br/>
<b>[Respecter la casse] est cochée</b><br/>
<b>[Le point correspond à tout] est cochée</b>
<p>La fonction <i>Upper-case text (ignore tags)</i>, change la min. en maj. sans modifier le contenu des balises. La regex prévoit la possibilité, qu’entre la ponct. et la lettre qui suit et doit être en majuscule, il puisse y avoir des guillemets ou une balise. Ces car. font partie de la sélection, mais ne sont pas modifiés. Lorsqu’elles rencontrent des car. qui ne sont pas des lettres, les fonctions de mise en maj. les laissent inchangés (ponctuations, espaces…).</p>
<p>Une espace doit obligatoirement précéder la min. Cette obligation permet d’éviter de sélectionner les points dans une url. L’absence d’espace après le point a été traitée par la règle 40.</p>
<p>La règle évite que le point soit précédé par une maj., par ex. dans la fin d’un sigle. Ex. : « La réunion de l’O.N.U. s'est déroulée dans le calme  ». Le point ne doit pas non plus faire partie de l’une des abréviations suivantes : ex., Ex., cf., Cf., éd., Éd., etc., op. cit., w.c., w.-c., c.-à-d., i.e.</p>

[72]
book
<b>[NCX][S][F1] Mettre la TdM en minuscules sauf la 1re lettre</b><br/>
<b>[Respecter la casse] est cochée</b>
<p>La table des matières (TdM) est souvent construite à partir des titres de chapitres, lesquels sont fréquemment en maj. Ces maj. dans la TdM ont un côté écrasant, inesthétique, qu’on peut vouloir transformer. C’est l’objectif de cette règle : transformer une entrée de la TdM en min. en laissant l’initiale de la phrase en maj. Seules les entrées possédant au moins un mot en maj. sont sélectionnées.</p>
<p>Dans la norme epub 2, le fichier contenant la TdM est dans un format spécifique, et possède l’extension ncx (toc.ncx la plupart des fois). Dans la norme epub 3, ce fichier est dans un format xhtml assurant une compatibilité ascendante. Il peut être nommé, par exemple, nav.xhtml. Contrairement à la norme epub 2, dans la norme epub 3, les entrées de la TdM peuvent contenir des balises. Ces balises ne sont pas modifiées par la règle.
<ul>
<li>La présence dans le dico de chaque mot, préalablement dépouillé des articles élidés « d’ » ou « l’ » et mis en min., est vérifiée. En cas d’absence, la seule initiale du mot est laissée en maj. Cela permet de traiter correctement les noms propres, lesquels figurent souvent dans les titres, quand ils ne sont pas aussi des noms communs.
<li>Les nombres romains (y compris “Ier”) dans les entrées de la TdM sont ignorés.
<li>La seule initiale du mot précédant un nombre romain est laissée en maj. si ce mot n’est séparé du nombre romain que par une espace (séc. ou pas). Il s’agit de prendre en compte un nom de roi, de reine, d’empereur ou de pape.
<li>« Mme » et « Mlle », entièrement en maj. ou pas, avec des balises de mise en exposant ou pas, sont traités correctement.
<li>Une maj. isolée, suivie par une ponct. (notamment « M. ») ou une balise, est laissée telle quelle.
</ul></p>
<p>Cette règle ne peut pas raisonnablement prendre en compte tous les cas possibles. Elle doit être considérée comme une aide à la réalisation de son objectif, et exécutée en pas à pas en observant le résultat.</p>

[73]
book
<b>Corriger les formes fautives de nbre ordinal abrégé</b><br/>
<b>[Respecter la casse] est cochée</b>
<p>L’objectif de la règle est de corriger les formes fautives de nombre ordinal, arabe ou romain, que l’abréviation soit en exposant ou pas, que le nombre romain soit en majuscules, ou en minuscules modifiées par un <i>span</i>.</p>
<p>Ni « ixième » ni sa forme fautive « xième » ne sont modifiés par la règle (absence du <i>span</i>). Les mots « énième » et sa forme fautive « nième » ne sont pas non plus modifiés.</p>
<p>1<sup>ère</sup>, 1<sup>ères</sup> => 1<sup>re</sup>, 1<sup>res</sup></p>
<p>2<sup>nd</sup>, 2<sup>nde</sup>, 2<sup>nds</sup>, 2<sup>ndes</sup> => 2<sup>d</sup>, 2<sup>de</sup>, 2<sup>ds</sup>, 2<sup>des</sup></p>
<p>2<sup>ème</sup>, 2<sup>ième</sup>, 2<sup>èmes</sup>, 2<sup>ièmes</sup> => 2<sup>e</sup>, 2<sup>es</sup></p>

[74]
star
<b>[S][F] N° de siècle ou de République en minuscules (-> majuscules)</b><br/>
<b>[Respecter la casse] est cochée</b><br/>
<b>La fonction <i>Upper-case text</i> est mise en oeuvre</b><br/>
<b>Prérequis : règle 73</b>
<p>On cherche des nombres romains en min. qui ne sont pas encadrés par une paire de balises <i>span</i>. On ne modifie pas les nombres encadrés par des <i>span</i> car cette balise met probablement en œuvre la propriété css « <i>font-variant: small-caps</i> ». [Respecter la casse] est sélectionné pour être sûr que le nombre romain est en min. Le caractère ordinal du chiffre suit, en exposant ou pas.</p>
<p>Le contenu des balises est ignoré.</p>
<p>Une assertion empêche de sélectionner quelques mots communs ressemblant à un nombre romain ordinal.</p>

[75]
star
<b>Petites capitales aux n° de siècle ou de République</b><br/>
<b>[Respecter la casse] est cochée</b><br/>
<b>Prérequis : règles 73 & 74</b>
<p>On cherche uniquement des nombres romains en maj., c’est la raison pour laquelle il faut sélectionner [Respecter la casse]. La règle 73 est un prérequis pour ne rater aucune occurrence potentielle. Le nombre romain ne doit pas être déjà en petites capitales (jeu sur la taille etc.). La règle affecte une taille d’environ 85% au nombre romain en l’encadrant par une paire de balises <i>small</i>.</p>
<p>L’expression prend en compte les chaînes de car. contenant deux chiffres romains comme : “au XIV<sup>e</sup> et au XV<sup>e</sup> siècles”, avec un 1<sup>er</sup> chiffre non directement suivi par “ siècle”. Le 2<sup>e</sup> chiffre ne peut prendre qu’un simple “e” final : pas de “I<sup>er</sup>” ou de “II<sup>nd</sup>”, ni de féminin ou de pluriel.</p>
[76]
book
<b>[S] Chercher des chaînes en majuscules</b><br/>
<b>[Respecter la casse] est cochée</b><br/>
<b>[Pas à pas] obligatoire</b>
<p>La règle cherche des chaînes de maj. pour vérifier manuellement si elles doivent être mises en petites capitales pour des raisons esthétiques dans la page. La chaîne de rempl. réduit <b>tous</b> les car. sélectionnés à une taille de 80% environ, ce qui n’est pas systématiquement souhaitable, puisqu’on peut, par ex., vouloir conserver une vraie maj. en début de chaîne et à l’initiale des noms propres.</p>
<p>La règle cherche à l’extérieur des balises une chaîne de <b>sept car. min.</b> pouvant appartenir à une chaîne de maj. (y compris les chiffres et les signes de ponct.). Le dernier car. est distingué pour éviter que ce soit une esp., un chiffre, ou un car. parmi “’,;:…/.-”. L’absence de l’esp. évite notamment les chaînes d’esp. créées par l’outil d’embellissement. L’absence de l’apostr. typo évite qu’une chaîne se terminant par un point continue sur l’initiale en maj. et l’apostr. du mot suivant.</p>
<p>La chaîne de rempl. change les car. sélectionnés en les encadrant par une paire de balises <i>small</i>. Si la chaîne est déjà suivie par une balise fermante <i>small</i> ou <i>span</i>, elle n’est pas sélectionnée.</p>
<p>La chaîne doit obligatoirement contenir des lettres, même si elle peut aussi contenir d’autres car.</p>
<p>Si vous voulez utiliser la propriété « font-variant: small-caps », il faudrait mettre la chaîne en min. avec une des fonctions dispo. <b>dans l’éditeur</b>.</p>

[80]
star
<b>[S] Inséc. entre 2 minuscules (-> séc.)</b><br/>
<b>[Respecter la casse] est cochée</b><br/>
<b>[Pas à pas] obligatoire</b><br/>
<b>Prérequis : règle 73</b>
<p>La règle remplace une inséc. entre deux min. par une séc. sauf si la 1<sup>re</sup> min. est la dernière lettre d’un suffixe ordinal, la dernière lettre “e” de “Mme” ou “Mlle”, ou la lettre “o” mise en exposant dans “N<sup>o</sup>” ou “n<sup>o</sup>”. Ainsi, si dans “IVe siècle” une inséc. sépare “e” de “siècle”, elle ne sera pas remplacée. Le sous-motif qui empêche le remplacement dans le cas d’un suffixe ordinal se déduit de l’expression de la règle suivante (voir le commentaire de celle-ci). Il est sensible à la casse, contrairement à l’expression suivante, en raison de l’objectif de la présente règle.</p>
<p>Une éventuelle balise séparant l'inséc. de l'une des lettres en min. (par ex. une balise d'italique) n’empêche pas le remplacement. Ni le non-remplacement pour les balises de mise en exposant dans un suffixe ordinal, dans “M<sup>me</sup>” ou “M<sup>lle</sup>”, ou dans “N<sup>o</sup>” ou “n<sup>o</sup>”.</p>
<p>La règle ignore les titres contenus entre les balises <i>h1</i>, <i>h2</i> etc.</p>
[81]
star
<b>(-> inséc.) après un nbre ordinal</b><br/>
<b>Prérequis : règle 73</b>
<p>La règle place une inséc. entre un nombre ordinal arabe ou romain et le mot suivant, sauf si ce mot est une des conjonctions suivantes : “et”, “ou”, “au”, “à la”, “comme” et “ni”. Ex. :</p>
<p style="text-align: center;">20<sup>e</sup> <b>et</b> 80<sup>e</sup> degrés ouest</p>
<p>Le suffixe ordinal peut être parmi : “e”, “er”, “d”, “de” et “re” (plus un éventuel “s” final marquant le pluriel). La règle 73, qui corrige les formes fautives, est un prérequis. Ces lettres peuvent être séparées par  0 à 2 balises du nombre, et par une balise fermante de l’esp. à remplacer. Ainsi, que le nombre romain soit en petites capitales ou pas (la règle 75 n’est pas un prérequis), et que le suffixe soit mis en exposant ou pas, tous ces cas sont pris en compte.</p>
<p>La règle est insensible à la casse, le cas où le nombre romain est en min. est traité. Ainsi, la règle 74 n’est pas un prérequis.</p>
<p>Une assertion empêche de sélectionner quelques mots communs ressemblant à un nombre romain ordinal.</p>

[83]
book
<b>Inséc. après un nbre cardinal</b>
<p>L’objectif de la règle est de placer une inséc. entre un nbre cardinal et le mot suivant, notamment les mois (y compris du calendrier révolutionnaire), les unités de mesure, les noms de peuples et une liste de noms communs.</p>
<p>Le cas du 1er du mois est traité par la règle 81.</p>
<p>L’inséc. entre "h" et les minutes est placée par la règle 8E. D’ailleurs, le nombre des minutes ne possède souvent pas d’unité.</p>
<p>L’espace après le chiffre n’est pas obligatoire, pour permettre de traiter le cas où % est collé au chiffre (un anglicisme), il en va de même pour h.</p>
<p>Les noms de peuple sont repérés comme étant un mot en min. avec une initiale en maj.</p>
<p>La règle est insensible à la casse, mais une partie est rendue sensible à la casse. C’est le cas des noms de peuple, pour vérifier que le mot est en min. avec une initiale en maj. C’est aussi le cas de la lettre « A » pour ne pas mettre l’insécable après le chiffre dans, par ex. : « Le n° 6 a gagné ».</p>
<p>La règle ignore le contenu des balises (on pourrait y trouver des styles avec le caractère %).</p>
[84]
book
<b>Séc. entre nom de rois etc. ou an et nbre romain (-> Inséc.)</b>
<p>L’objectif de la règle est de mettre une inséc. entre un nom de roi, de reine, d’empereur, de pape ou « an » et leur n° en chiffres romains. Le nbre romain doit se terminer sur une limite de mot, pour éviter tous les noms propres qui commencent par une des lettres [IVX].</p>
<p>Les règles de typographie conviennent de ne pas mettre le nbre romain en petites capitales, aussi la règle ne le prévoit pas. Si le texte contrevient à cette règle, le nom ne sera pas sélectionné puisque le nombre romain serait encadré par une paire de balises.</p>
<p>De même, les années du calendrier républicain s’écrivent en maj. romaines (le 18 brumaire an VIII).</p>
[85]
book
<b>[S] Inséc. entre numéro, n°, chapitre, etc. & un nbre cardinal</b>
<p>Ne pas cocher la case [<i>Respecter la casse</i>] autorise que l’initiale et même tout le mot soient en maj.</p>
<p><b>Une première branche</b> met une inséc. entre un mot appartenant à la liste suivante et un nombre arabe, qui peut éventuellement être suivi d’une ou plusieurs lettres.</p>
<p style="text-align: center;">(l’)an, années, (l’)été, (l’)hiver, début, fin, numéro, n°, n + lettre “o” en exposant, page, box, catégorie, chambre, scène, zone</p>
<p><b>La seconde branche</b> met une inséc. entre un mot appartenant à la liste suivante et un nombre arabe ou romain, à condition que le nombre ne termine pas un titre (fin de chaîne entre des balises <i>h+chiffre</i> ou <i>title</i>).</p>
<p style="text-align: center;">tome, partie, section, chapitre, article, acte, psaume, verset</p>
<p><b>Le nombre romain doit être en maj.</b> Il ne devrait pas être en petites capitales. Si jamais il l’était, l’inséc. ne sera pas mise puisque le nombre romain serait encadré par une paire de balises.</p>
<p>Le nombre romain peut contenir “bis” ou “ter”.</p>

[86]
warning
<b>[F1] (-> Inséc.) après Mme(s), Mlle(s), Mgr(s), Me, Mr(s), Miss ou miss, Sir ou sir, Dr et Pr</b><br/>
<b>[Respecter la casse] est cochée</b><br/>
<b>La fonction <i>Maj_point_insec</i> est mise en oeuvre</b>
<b>Prérequis : règles 40, 57</b>
<p>L’objectif de la règle est de placer une inséc. après M., Mme(s), Mlle(s), Mgr(s), Me, Mr(s), Ms, Miss ou miss, Sir ou sir, Dr, Pr ou bien un prénom abrégé à son initiale en maj., si la lettre suivant la civilité ou l’initiale est en maj. (ex. : M. Dupont). Cette condition, qui impose de respecter la casse, évite de mettre une inséc. après « Me » dans une phrase comme : “Me dire ça à moi !”</p>
<p>La règle prend en compte les cas où :
<ul>
<li>Le prénom abrégé est composé (ex. : M.-C. Barrault). Mais il n’y a pas remplacement si la maj. isolée est précédée par un tiret lui-même précédé par un autre caractère que le point : “Il habite au 2-A. C'est une chambre de bonne.” Le prénom composé J.-C. ne doit pas être précédé par “av.”, “apr.”, “ap.”, “avant” ou “après” pour éviter une phrase telle que : « En 54 apr. J.-C. Néron fut couronné empereur ».
<li>Les caractères suivant les lettres initiales M, D ou P sont mis en exposant (ou non).
<li>Une particule s’interpose entre la civilité ou l’initiale du prénom et le nom (ex. : Mme de La Fayette). L’inséc. sera placée entre la civilité ou l’initiale et la particule et entre la particule et le nom (et pas à l’intérieur d’une particule composée).
<li>Une particule <b>étrangère</b> s’interpose entre le prénom et le nom (ex. : Vincent van Gogh). L’inséc. sera placée entre la particule et le nom (et pas à l’intérieur d’une particule composée). Les particules françaises sont évitées pour ignorer des chaînes comme : « Université de Paris ».
<li>La maj. abrégée est la dernière lettre d’un sigle.
<li>La maj. abrégée fait partie d’une expression contenant une maj. unique suivie d'un point parce qu’elle termine la phrase. Ainsi, Dans des phrases telles que : « Je suivis son plan de A à Z. Il avait raison. », ou « J’entre dans une salle en L. Je laisse la porte ouverte. » La règle évite de mettre une insécable entre “Z.” et “Il” et entre “L.” et “Je”.
<li>La maj. isolée est précédée par une inséc. : celle-ci doit être elle-même précédée par un point ou un guillemet ouvrant fr.
<li>Un point a été ajouté après Mr, Mrs, Ms, Dr ou Pr (ex. : Mr. ou Pr.), ce qui est fautif (un américanisme). La regex le laisse (inséc. après un point, exception à la règle 40).
</ul></p>
<p><b>Deux maj. suivies d'un point</b> séparées par une espace, sécable ou pas (ex. : le nom du prix Nobel de littérature 1948 : T. S. Eliot) sont traitées successivement. Quand les deux maj. suivies d'un point sont collées ensemble (ex. : T.S. Eliot), elles restent collées, et la règle remplace l’espace suivante par une inséc. Si la double maj. est “O.K.” ou “K.O.”, l’espace suivante n’est pas modifiée.</p>
<p><b>Cas d’une initiale en middle name</b></p>
<p>Dans le cas d’une initiale en <i><b>middle name</b></i> après un prénom complet, comme dans John F. Kennedy, la règle est de placer une inséc. avant l’initiale et non après. Pour repérer un prénom complet, on regarde si le mot qui précède l’initiale a une maj. pour 1<sup>re</sup> lettre et des min. ensuite.</p>
<p>Si le prénom complet est précédé d’une balise, par exemple d’italique, l’initiale ne sera pas sélectionnée.</p>
<p>L’initiale n’est pas sélectionnée si le mot qui la précède possède une initiale en maj. parce qu’il commence la phrase, comme dans cet ex. où il ne faut pas placer une inséc. après <i>Ni</i> :</p>
<p>“Blablabla. Ni M. Durand ni moi n'approuvons votre choix.”</p>
<p><b>Conséquences :</b> si le nom avec une initiale en middle name commence la phrase, il ne sera pas non plus sélectionné, et gardera une inséc. après et non avant. Cet inconvénient est jugé mineur en regard de l’évitement de faux positifs.</p>
<p>Si le nom avec une initiale en middle name est écrit en maj., il ne sera pas non plus sélectionné et gardera une inséc. après et non avant. Il s’agit encore d’éviter des faux positifs puisque la maj. du mot qui précède perd sa particularité d’être en maj.</p>
<p>Le changement de « Mr » en « M. » et de « Mrs » en « Mme » est proposé par la règle 91.</p>
[87]
book
<b>(-> inséc.) après une particule étrangère</b><br/>
<b>[Respecter la casse] est cochée</b>
<p>La règle 86 insère une inséc. entre la particule et le nom de famille dans le cas où ils sont précédés d’une civilité ou d’un prénom. La règle 87 tente de faire de même dans d’autres cas de nom à particule, pour les seules particules étrangères. Ex. : "van Gogh", "von Stroheim", "di Baggio", "dos Santos", "de los Santos", "de las Casas", "lo Celso" ou "del Sarto".</p>

[89]
star
<b>[S] (-> inséc.) avant une majuscule unique</b><br/>
<b>[Respecter la casse] est cochée</b>
<b>Prérequis : règles 86, 0B</b>
<p>Cette règle permet de placer une inséc. avant la maj. dans une expression telle que « plan B », ou « rayon X ». Elle le permet aussi avant la lettre abrégeant les points cardinaux dans les latitudes et longitudes (seulement si le symbole des secondes est le caractère double prime, voir la règle 0B). La maj. ne doit pas avoir d’accent.</p>
<p>La maj. unique doit être précédée d’une espace séc. Si la maj. isolée est la première lettre d’un paragraphe, elle ne peut pas être précédée d’une espace (règle 60), même s’il s’agit d’un dialogue car le cadratin (ou le demi-cadratin chez certains) est suivi d’une espace inséc. et non pas séc. (règle 51). Il en va de même pour les guillemets français ouvrants, qui ne figurent donc pas dans la liste.</p>
<p>Dans le but de limiter le nombre de faux positifs, cette espace séc. <b>ne peut elle-même être précédée par :</b>
<ul>
<li>une lettre maj. (évite les maj. unique à l’intérieur de chaînes en maj.) ;
<li>une ponctuation parmi “.,?!…:”. Cela concerne notamment la lettre Y, par exemple dans : « <i>Nos amis sont à la plage. Y vas-tu aussi ?</i> ». Mais aussi des lettres A pas encore accentuées en début de phrase (la règle 90 vient après). La ponctuation ";" ne fait pas partie de la liste pour permettre de remplacer éventuellement l’espace par une insécable après l’entité "&amp;" (exemple : <i>le magasin C &amp; A</i>) ;
<li>les mots « le », « partie » et « chapitre » (et les mêmes avec l’initiale en maj., le mot entièrement en maj. étant interdit par le 1<sup>er</sup> alinéa ci-dessus). Ex. : Le Z de Zorro, Partie V, Chapitre X. Concernant <i>Partie</i> et <i>Chapitre</i>, l’idée est la suivante : ou bien on met l’inséc. entre le mot et tous les nombres romains, ou bien aucun, mais il n’y a aucune raison de le faire uniquement pour les nombres I, V et X. Le remplacement par l’inséc. dans ces cas, sauf à l’intérieur d’un titre, est fait par la règle 85.
</ul></p>
<p>La maj. <b>ne peut être suivie par :</b>
<ul>
<li>un point suivi d’une espace, une éventuelle balise puis d’une min (ex. : Je connais M. le comte) ;
<li><sup (évite « M<sup>me</sup> » et « M<sup>lle</sup> ») ;
<li><span ou <small (à cause des petites capitales obtenues en jouant sur l’attribut size) ;
<li>une espace séc. ou pas suivie de « à », « = », ou « & » ; (évite A dans l’expression « de A à Z », les calculs du genre « E = mc2 ») ;
<li>les car. « ° », « & » ou « - » (évite de sélectionner la maj. dans « du N°5 », « C&amp;A » « T-shirt » ou « A-t-il quelque chose à voir ») ;
<li>un point suivi : d’une inséc. (évite notamment l’abréviation M.), ou d’un tiret séc. ou pas (évite J.-C.), ou bien une maj. (évite la 1<sup>re</sup> lettre d’un sigle).
</ul></p>
<p>La règle 86 est un prérequis, puisqu’on n’évite l’abréviation M. que si elle est suivie d’une inséc.</p>

[8C]
book
<b>Séparateur de milliers (nbre > 9999)</b>
<p>Le nombre ne doit pas être un numéro ISBN ou Sodis, un numéro d’édition, un matricule, ni contenir un tiret (trait d’union, tiret inséc. et demi-cadratin).</p>
<p>En typographie, on ne sépare pas les chiffres en tranches de trois quand il s'agit d'un numéro ou d'un nombre ordinal, c’est-à-dire qui exprime le rang d'un élément au sein d'un ensemble. Le nombre ne doit donc pas être précédé de « numéro », « n° » ou « n<balise>o</balise> ». Il ne doit pas non plus être suivi de « e » ou d’une balise. Ex. : le 10000e spectateur.</p>
<p>Pour les autres nombres, le séparateur inséré est une inséc. Si le nombre possède déjà une séc. comme séparateur de milliers, elle est remplacée par une inséc. Pour éviter les années, les nombres à 4 chiffres sont évités, sauf s’ils possèdent déjà une séc. comme séparateur. Ces nombres à 4 chiffres pourront être examinés en pas à pas par la règle suivante.</p>
<p>Le nombre ne doit pas faire partie d’une balise ou d’un style embarqué.</p>

[8D]
book
<b>Séparateur de milliers (nbre de 4 chiffres)</b>
<p>La regex évite la sélection quand le nombre est précédé d’un nom de mois ou de saison, d’une balise de fermeture <i>sup</i>, d’un caractère parmi à, la virgule, ou « ° », ou d’une des chaînes suivantes, suivis d’une espace, sécable ou non :</p>
<p style="text-align: center;">de, depuis, dès, en, entre, et, an, année, années, vers, millésime</p>
<p>Sauf si le nombre est suivi par une espace puis « m » ou « km », pour pouvoir sélectionner un nombre à 4 chiffres s’il est suivi de « m » ou « km », même s’il est précédé de « à », « et », « entre », « depuis » ou « de »… Ex. : « une distance de 1022 km », qui serait, sinon, évité parce qu’il est précédé par « de ».</p>
<p>Le caractère qui précède immédiatement le nombre ne peut pas être un chiffre, une virgule, un point, une parenthèse ouvrante, un slash ou un tiret sécable ou pas.</p>
<p>Le caractère qui suit immédiatement le nombre ne peut pas être un chiffre, une parenthèse fermante ou un tiret sécable ou pas.</p>
<p>Toutes ces assertions visent notamment à éviter de sélectionner une année à 4 chiffres, ou lorsque le nombre est précédé de n° ou « n » suivi de « o » encadré par une paire de balises <i>sup</i>.</p>
<p>Le signe « moins » collé au chiffre qui suit a été placé par la règle 52. Les nombres négatifs à 4 chiffres sont traités par la regex quand le caractère négatif est marqué par ce signe « moins », mais pas quand il est marqué par un tiret.</p>

[8F]
book
<b>Sécable entre une marque d’arme et son modèle ou son calibre (-> insécable)</b><br/>
<b>[Respecter la casse] est cochée</b>
<p>La règle remplace une séc. entre une marque d’arme et son modèle ou son calibre par une inséc. Elle remplace également une séc. entre les mots “calibre” ou “Calibre” et la taille du calibre.</p>
<p>La marque peut être :</p>
<p>Beretta, Browning, [cC]alibre, Colt, Famas, Glock, Heckler & Koch, HK, Kalashnikov, Magnum, Manurhin, Mauser, Python, Remington, Smith & Wesson, S&W, Winchester</p>
<p>Le modèle doit obligatoirement être composé de maj., de chiffres, de points et de virgules.</p>

[90]
book
<b>Lettre A isolée non accentué (-> À)</b><br/>
<b>[Respecter la casse] est cochée</b>
<p>L’objectif de la règle est d’accentuer certaines lettres “A” isolées.</p>
<p>“A” doit être précédé d'une ponct. parmi —–)>«»”"?.!…;: suivie d'une espace séc. ou pas, ou précédé directement d'une ponct. parmi >("“</p>
<p>Le caractère “>” permet de sélectionner “A” quand la lettre est immédiatement précédée d’une balise. La ponct. ne peut pas être le point-virgule final des entités html “&amp ;”, “&gt ;” ou “&lt ;”.</p>
<p>“A” doit être suivi d'une espace séc. ou pas, puis d’un car. alphanum., lui-même suivi par un car. alphanum., d'une apostrophe, d’une quote droite ou d'une espace.</p>
<p>“A” ne doit pas faire partie des expressions latines suivantes : A fortiori, A priori, A contrario, A posteriori ou A minima.</p>

[91]
book
<b>[F] Mr, Mrs -> M., Mme</b><br/>
<b>[Respecter la casse] est cochée</b><br/>
<b>La fonction <i>Mr(s)</i> est mise en oeuvre</b>
<p>L’objectif de la règle est de remplacer les anglicismes « Mr » et « Mrs » (éventuellement suivis d’un point) par respectivement « M. » et « Mme ».</p>
<p>Si la partie en min. de l’anglicisme est précédée ou suivie par une balise, ces balises sont conservées dans le cas M<…>rs<…>, et supprimées dans le cas M<…>r<…>. En effet, on peut supposer qu’il s’agit d’une paire de balises de mise en exposant, qu’il n’y a pas de sens de conserver autour du point de M. En l’absence de balises, la mise en exposant de « me » dans « Mme » est proposée plus bas.</p>
<p>« Mr » n’est pas l’abréviation de « monsieur », mais de l’anglais « mister ». En français, l’abréviation est « M. ». On peut tolérer des exceptions, selon le contexte, surtout s’il est concevable de prononcer mister. Par exemple pour le nom d’un chien : on peut imaginer, en français, de l’appeler « mister Bob ». Autre exception : les magasins <i>Mr Bricolage</i> (nom qui se prononce monsieur dans les publicités…).</p>
<p>Si certains abrègent monsieur en « Mr », la tentation est grande d’abréger messieurs en « Mrs ». Or « Mrs », n’est pas l’abréviation de « messieurs », mais de l’anglais « mistress » (madame). En français, l’abréviation de « messieurs » est « MM. ». Pour cette raison, nous recommandons la prudence dans le remplacement de « Mrs », sans rendre le pas à pas obligatoire.</p>

[92]
book
<b>[S][F] -> Il(s) ou il(s)</b><br/>
<b>[Respecter la casse] est cochée</b><br/>
<b>La fonction <i>Ils</i> est mise en oeuvre</b>
<p>L’objectif de la règle est de proposer de remplacer :
<ul>
<li>par « il » les mots de cette liste : iI, if, i1, If, I1, lI, ll, l1, 1I, 1l et 11
<li>par « Il » les mots de la même liste plus ii, II, H, U et //
<li>par “Il a” le mot “Ha” quand <b>il n'est pas suivi</b> par une ponctuation ou un tiret, “bon”, “non”, “ça”, “ha”, “la”, “là”, “oui”, “merde”, “si”, “tiens”, “zut” (ex. : Ha bien fait).
</ul></p>
<p>Dans les deux premiers cas, si le mot est suivi par un “s”, la lettre est conservée (-> Ils ou ils). Le mot doit être suivi par une espace ou les points de suspension. Cette espace doit être sécable dans le cas de “11”.</p>
<p>Pour être sélectionné, le mot de la 1<sup>re</sup> liste doit être précédé par une ponctuation parmi “>—–.;:!?…()«»“”"”, éventuellement suivie par une séc. ou une inséc. C’est ce qui incite à penser que le “i” est en maj. Cela évite aussi de sélectionner des chaînes telles que « Chapitre II » ou « Alexandre II ».</p>
<p>Pour être sélectionné, le mot de la 2<sup>e</sup> liste doit être précédé par une lettre suivie par une espace ou une apostrophe.</p>
<p><b>Attention</b>, dans un epub, une conversation sur Dieu comportait de nombreux « Il » au milieu des phrases. Contrôler ce cas par regex aurait engendré ici des faux positifs.</p>
<p>Ces cas ne sont pas rarissimes, malgré les macros et les relectures. Ils ont souvent déjà été détectés par l’étape de vérification d’orthographe (sauf if, If, II, 11, H, U et //), si vous l’avez exécutée.</p>

[97]
book
<b>[S][F1] Mot commençant par E (-> É)</b><br/>
<b>[Respecter la casse] est cochée</b><br/>
<b>La fonction <i>Initial_E</i> est mise en oeuvre</b>
<p>La fonction remplace l’initiale E par É si trois conditions sont remplies :
<ul>
<li>le mot sélectionné ne figure pas dans le dictionnaire fr (avant remplacement)
<li>le mot sélectionné ne figure pas dans le dictionnaire en (avant remplacement)
<li>le mot sélectionné, après remplacement de l’initiale E par É, figure dans le dictionnaire fr.
</ul></p>
<p>Ces cas ont souvent été détectés par la vérification d’orthographe, si vous l’avez exécutée.</p>
<p>Dans le cas contraire, la fonction remplace le mot par lui-même, il n’y a pas de modification du texte. Le résultat du comptage est donc toujours supérieur ou égal au nombre de remplacement effectués, jamais inférieur.</p>
<p>La regex évite de sélectionner des faux positifs potentiels, comme <i>Education</i>, dont c’est l’orthographe en anglais, potentiellement correcte suivant le contexte dans le texte français.</p>
<p>Elle évite de sélectionner <i>Ed, Eddy, Edward, Ernest, Ernie</i> et <i>Eve</i>. Présents dans le dictionnaire français, ils ne seraient de toute façon pas remplacés. Mais en empêchant leur sélection, l’assertion rapproche le résultat du comptage du nombre de remplacements effectifs.</p>
<p>Elle évite de sélectionner <i>Erreur, Errol</i> (ou <i>Erroll</i>) et <i>Everglade</i>. <i>Érreur, Érrol</i> (ou <i>Érroll</i>) et <i>Éverglade</i>, absents du dictionnaire, écarteraient le remplacement. Mais en empêchant leur sélection, l’assertion rapproche le résultat du comptage du nombre de remplacements effectifs.</p>
<p>Même si la règle 96 n’a pas été exécutée, celle-ci ne sélectionne ni <i>Etes</i> ni <i>Etre</i>.</p>
<p>La regex évite de sélectionner à l’intérieur d’une balise ou d’un style embarqué (exemple : <p class="Etoile">).</p>

[9A]
book
<b>[F] par-dessus <-> pardessus)</b><br/>
<b>La fonction <i>Pardessus</i> est mise en oeuvre</b>
<p>Une liste est composée des mots suivants : un, au(x), ce(s), de(s), du, deux, en, le(s), leur(s), mon, ton, son, mes, tes, ses, nos, vos, notre, votre, élégant(s), beau(x), quel, auquel, duquel, lequel.</p>
<p>Pour être sélectionné, “par-dessus” doit être précédé par un des mots de la liste. Ce sont les cas certains. D’autres cas peuvent éventuellement échapper à la règle, qui n’est pas systématique. La liste peut être allongée.</p>
<p>Si la règle trouve un cas où “par-dessus” doit être remplacé, on peut vérifier sur l’ensemble des occurrences en cherchant “par-dessus” dans les recherches classiques de l’éditeur.</p>
<p>Pour être sélectionné, “pardessus” ne doit pas être précédé par un des mots de la liste. Le remplacement n’aurait pas de sens dans le cas contraire.</p>
<p>"par" et "dessus" sont capturés séparément pour être reproduits dans le remplacement, afin de retrouver le même agencement maj./min. ([Respecter la casse] n’est pas cochée).</p>
<p>Cette erreur potentielle n’est pas repérée par la vérification d’orthographe.</p>

[9H]
book
<b>[F] cl (-> “d” ou “et”)</b><br/>
<b>[Respecter la casse] est cochée</b><br/>
<b>La fonction <i>cl</i> est mise en oeuvre</b>
<p>La règle remplace le mot “cl” par “et”, le mot “clans” par “dans”, et le mot “cloute” par “doute”.</p>
<p>“clans” n’est pas sélectionné s’il est précédé par :</p>
<p style="text-align: center;">aux, de, des, [lL]es, [lL]eurs, [nNvV]os, autres, deux, [eE]ntre, mêmes</p>
<p>“clans” n’est pas sélectionné s’il est suivi par une ponctuation ou par :</p>
<p style="text-align: center;">qui, que, ou, et, de, des, au, d’un, sont, étaient, étant, ont, avaient, ayant, familiaux</p>

[9J]
book
<b>[F] oe <-> œ</b><br/>
<b>[Respecter la casse] est cochée</b><br/>
<b>La fonction <i>Ligature oe</i> est mise en oeuvre</b>
<p>L’objectif de la règle est de corriger les mots possédant la ligature « œ » ou le digramme « oe » en min. Sauf son initiale, le mot doit donc être aussi en min. La règle ignore le digramme  « oe » à l’intérieur d’un lien.</p>
<p>La règle vérifie si le mot est présent dans le dico en tant que mot commun. Est considéré comme nom propre tout mot dont l’initiale est une maj. et qui n’est pas un mot commun du dico.
<ul>
<li>Tous les <b>noms propres</b> reçoivent « oe », sauf Œdipe (traitement particulier dans la fonction). Attention, œdipe est aussi un mot commun. Le français est une des très rares langues à utiliser cette ligature, c’est pourquoi la règle s’attend à ce que les noms propres étrangers inconnus s’écrivent avec « oe ».
<li>Phoenix est considéré par la fonction comme un nom commun à cause de la présence dans le dico de « phœnix » et reçoit un traitement particulier.
</ul></p>
<p>La règle permet de redresser avec « oe » certaines familles de <b>mots communs</b> :
<ul>
<li>Les mots comportant certains préfixes : auto (autoentrepreneur), électro (électroencéphalogramme), gastro (gastroentérite), micro (microentreprise), pro (proeuropéen).
<li>Les mots dans les familles coef (coefficient), coer (coercitif, incoercible), coex (coexistence) et moel (moelleux).
<li>Une liste de mots ou de racines : boer, boette, capoeira, does, floe, foehn, groenlandais, minoen, roentgen.
</ul></p>
<p>Tous les autres mots communs situés en dehors des balises reçoivent « œ ».</p>
[9K]
book
<b>[F] ae (-> æ)</b><br/>
<b>La fonction <i>Ligature ae</i> est mise en oeuvre</b>
<p>La règle remplace le digramme “ae” par la ligature dans les mots suivants :</p>
<p>ex aequo, Laetitia, curriculum vitae, caecal, caecaux, caecum, novae, supernovae, hypernovae, lapsus linguae, ad vitam aeternam, taenia, et caetera, naevi, naevo-cellulaire, naevus</p>
<p>Il se peut que certains mots ne figurent pas dans la liste parce que les 2 orthographes sont admises.</p>
<p>La fonction permet de remplacer “ae” que le digramme soit en min. ou en maj.</p>

[9M]
book
<b>[S] i -> l part1 (mai -> mal, salie -> salle, Caria -> Carla, basket-bail -> basket-ball etc.)</b><br/>
<b>[Respecter la casse] est cochée</b>
<p>La règle remplace « i » par « l » dans :
<ul>
<li>« mai » sauf si précédé ou suivi par un chiffre, précédé par « mois de », début, fin, depuis, jusqu’à
<li>sali, Cari, Caria, Kari, Karia, base-bail, basebail, basket-bail, basketbail, hand-bail, handbail, punching-bail, punchingbail, volley-bail et volleybail.
</ul></p>
<p>Cari, Caria et Kari ne sont pas détectés par la vérification d’orthographe.</p>
[9N]
book
<b>[S] i -> l part2 (animai -> animal, conjug. égaie -> égale, parier -> parler)</b><br/>
<b>[Respecter la casse] est cochée</b>
<p>La règle remplace « animai » par « animal », toutes les formes conjuguées de « parier » par « parler » et toutes les formes conjuguées avec un « i » d’« égayer »par « égaler ».</p>

[A0]
book
<b>[CSS] Création du style exposant dans le(s) fichier(s) css (s’il n’existe pas)</b>
<p>L’objectif de cette règle est de créer le style qui sera utilisé pour mettre en exposant dans les règles qui suivent. Elle crée le style suivant, à la fin des feuilles de style, si un style du même nom n’existe pas déjà :</p>
<p>.exposant {</p>
<p>	font-size: 70%;</p>
<p>	vertical-align: text-top;</p>
<p>}</p>
<p>L’élément <i>sup</i>, qui permet la mise en exposant, possède par défaut la propriété <i>vertical-align: super</i>. Cette dernière déporte trop l’exposant et provoque un décalage de la ligne par rapport à celles qui l’entourent. Pour cette raison nous choisissons de créer un style, en affectant la valeur <i>text-top</i> (<i>top</i> convient également) à la propriété <i>vertical-align</i>.</p>
<p><i>text-top</i> aligne l’exposant sur le haut de la <i>content-area</i>, laquelle dépend des métriques des fontes, et non de <i>line-height</i>. Le déport est nettement moins important qu’avec la valeur par défaut.</p>

[A1]
book
<b>Exposant dans un nbre ordinal</b><br/>
<b>[Respecter la casse] est cochée</b><br/>
<p>La règle met en exposant l’abréviation d’un nombre ordinal, arabe ou romain, qui ne l’est pas déjà. Elle l’entoure d’une paire de balises <i>sup</i> utilisant le style « exposant » (voir la règle A0). Elle suppose donc que ce style existe. Dans le cas contraire, elle n’introduit pas d’erreur de syntaxe : L’abréviation sera mise en exposant avec le paramétrage par défaut de <i>sup</i> (qui présente des inconvénients corrigés par le style « exposant »).</p>
<p>La regex évite la sélection de mots que la description ramassée d’un chiffre ordinal romain par la règle sélectionnerait sinon : Id, Ids, Ide, Ides, Ver et Vers.</p>
<p>La regex ne sélectionne pas à l’intérieur des balises, ni entre les balises <i>title</i>.</p>

[B0]
book
<b>Signes “+” ou “=” (-> encadré par des inséc.)</b>
<p>La règle sélectionne tous les signes « = » du texte, sauf ceux qui sont déjà encadrés par des inséc., ceux qui sont à l’intérieur d’une balise (comme, par ex. classe="standard"), ceux qui sont à l’intérieur d’une url, ou dans le mot « [Cc]anal+ ». Elle insère une inséc. ou remplace une séc. avant et après le signe.</p>
<p>Si le signe « + » est immédiatement suivi par un nombre, avec ou sans séparateur décimal (une virgule), puis une inséc. facultative, puis le symbole « ° » ou « % » puis une lettre facultative « C » ou « F », la règle ne change rien. Ex. : « La température est de +7°C. » n’est pas modifié.</p>


[C0]
book
<b>[S] Mots dupliqués consécutifs (-> suppr)</b>
<p>La règle sélectionne les mots dupliqués consécutifs séparés par une espace, séc. ou pas. Le mot dupliqué ne doit pas appartenir à une liste d’exceptions. Le respect de la casse n’est pas activé, ce qui permet d’éviter la même liste de mots, en maj. ou avec une initiale en maj. Quelques ex. d’expressions évitées :</p>
<p style="margin-left: 3em;">viewBox="0 0 499 821"</p>
<p style="margin-left: 3em;">nous nous regardons</p>
<p style="margin-left: 3em;">vous vous levez</p>
<p style="margin-left: 3em;">Aide-toi toi-même</p>
<p style="margin-left: 3em;">C’est en en parlant qu’on peut se réconcilier</p>
<p style="margin-left: 3em;">à la queue leu leu</p>
<p style="margin-left: 3em;">Je vais lui faire faire ses devoirs</p>
<p style="margin-left: 3em;">À qui mieux mieux</p>
<p style="margin-left: 3em;">Peins-la la tête de profil</p>
<p style="margin-left: 3em;">Prends-le le goulot en haut</p>
<p style="margin-left: 3em;">Est-ce ce que tu voulais ?</p>
<p style="margin-left: 3em;">Bye bye</p>
<p style="margin-left: 3em;">Ouais ouais</p>
<p style="margin-left: 3em;">ha ha !</p>
<p style="margin-left: 3em;">oh oh !</p>
<p style="margin-left: 3em;">vroom vroom</p>
<p>Si une ponctuation sépare deux mots identiques, ils ne seront pas sélectionnés.</p>


[D1]
warning
<b>[F] Mot commençant par F, L, P, T ou V (-> l’)</b><br/>
<b>[Respecter la casse] est cochée</b><br/>
<b>[Le point correspond à tout] est cochée</b><br/>
<b>La fonction <i>Élision</i> est mise en oeuvre</b>
<p>L’objectif de la règle est de traiter des cas de confusion entre une initiale en maj. parmi “FLPTV” et « l’ ». Elle cherche un mot en min. avec une initiale en maj. parmi “FLPTV” et qui n'est pas en début de paragraphe ou précédé par une ponct. parmi “.?!:;…»” (même avec une parenthèse intercalée).</p>
<p>La maj. doit être suivie par une voyelle, elle-même suivie par deux lettres quelconques.</p>
<p>Le mot ne doit pas être suivi par un tiret, sauf si ce dernier est lui-même suivi par un pronom personnel sujet, avec un possible “t” euphonique (ex. : “Pavait-il dit”, “Pagace-t-il”). Il ne doit pas être précédé par un tiret. Cela permet d’éviter tous les noms propres composés, notamment les noms de ville (ex. : Pont-sur-Yonne)</p>
<p>Le mot ne doit pas être précédée par un de ces mots : le, la, les, des, du, un, une, au, aux, ce, ces, cet, cette, mon, son, ta, tes, ton, sa, ses, son, leur, leurs, nos, notre, vos, votre. Elle ne peut pas non plus être précédée par une balise <i>i</i>, <i>em</i>, <i>span</i> ou <i>sup</i>.</p>
<p>Le mot ne doit pas faire partie d’une chaîne de deux mots en min. avec une initiale en maj., éventuellement séparés par « de » ou « d’ ». Ex : dans <i>Parc d’Attraction</i>, Parc ne sera pas sélectionné.</p>
<p>Le mot ne doit pas faire partie de cette liste d’exclusion : Fils, Lana, Lara, Laura, Lars, Léon, Lester, Lois, Love, Pallas, Parque, Père, Perse, Post, Tara, Terre, Test, Tibère, Tout, Tunis et Vargas.</p>
<p>(Pété -> l'été) doit pouvoir être ciblé, mais pas si le mot est suivi de “ un câble”. Pareil pour “Pétant”.</p>
<p>Le mot doit être à l’extérieur des balises, et venir après la balise <i>body</i>.</p>
<p><b>La fonction</b></p>
<p>Si le mot est dans le dictionnaire, et le mot privé de son initiale également, on remplace la maj. par « l’ ».</p>
<p>(Panière -> l'arrière) est forcé par la fonction. Sinon, « l'anière », moins fréquent, ne serait de toute façon pas proposé parce que « anière » ne figure pas dans le dico.</p>
<p><b>Vérification du résultat</b></p>
<p>La regex sélectionne les mots à tester, ce qui n’a pas de signification puisque la présence ou non du mot dans le dico n’est pas encore testée. En mode auto, Il est recommandé de cliquer sur [<i>Voir ce qui a changé</i>]. Dans cette fenêtre, on peut alors annuler les changements, ou ne modifier que quelques résultats tout en validant les autres, comme expliqué dans le <i>Guide</i>. Dans la télécommande du pas à pas, le libellé “Voir le remplacement (survol)” devient rouge lorsque le remplacement est différent de la chaîne remplacée. On visualise le remplacement proposé en survolant le libellé avec la souris.</p>


[D2]
book
<b>[F] na -> n’a, ma(s) -> m’a(s), mes -> m’es, tes -> t’es</b><br/>
<b>[Respecter la casse] est cochée</b><br/>
<b>La fonction <i>Élision2</i> est mise en oeuvre</b>
<p>La règle ajoute une apostr. à « ma(s) », « na », « mes » et « tes » quand c’est justifié.</p>
<p><b>“ma” précédé et suivi par une espace</b></p>
<p>Il doit être précédé par :
<ul>
<li>une ponct. parmi “.?!:…–—«” suivie par une espace, ou bien une balise, éventuellement suivies par « Qu’ » ou « qu’ », puis “il”, “elle”, “on”, “qui”, “lequel”, “laquelle” ou ces mêmes mots avec l’initiale en maj., ou un mot avec l'initiale en maj. (sauf “Que”) si ce mot est <b>un nom propre</b>. Pour le vérifier, le mot mis en min. par la fonction ne doit pas être validé par le dico ou appartenir à une liste de prénom qui sont aussi des mots communs. Ex. : Blabla. Il ma appelé au téléphone.
<li>« qu’ » ou une espace, suivi par “il”, “elle”, “on”, “qui”, “lequel”, “laquelle” ou un mot avec l'initiale en maj. (sauf “Que”). Ex. : Les conseils qu’elle ma donnés étaient profitables.
</ul></p>
<p><b>“ma” précédé de “que” ou “Que” + espace, et suivi par une espace</b></p>
<p>Si la fonction trouve ensuite un mot qui est un verbe, avec éventuellement un adverbe intercalé, elle ajoute une apostrophe. Ex. : Le signal que ma enfin donné mon entraineur. La fonction adverbiale peut être composée de plusieurs mots. Ex. : Le suspect que ma à peu près décrit le témoin.</p>
<p><b>“na” suivi par une espace sécable</b></p>
<p>La règle insère l’apostrophe. L’espace sécable écarte le cas de l’interjection « na ! ».</p>
<p><b>“mas”, “mes”, “tes” suivis par une rupture de mot</b></p>
<p>Ils doivent être précédés par “tu” ou “Tu” suivis par une espace.</p>

[D3]
book
<b>[F1] quelle(s), Quelle(s) -> qu'elle(s), Qu'elle(s)</b><br/>
<b>[Respecter la casse] est cochée</b><br/>
<b>La fonction <i>Quelle</i> est mise en oeuvre</b>
<p>L’objectif de la règle est de traiter des cas dans lesquelles la forme pronominale “qu’elle(s)” qui introduit une proposition subordonnée, est confondue avec l’adjectif indéfini “quelle(s)”. La règle élimine d’abord des cas où le mot qui précède ou suit “quelle(s)” certifie la bonne orthographe. De même, elle sélectionne des cas où le mot qui précède ou suit “quelle(s)” certifie qu’il faudra ajouter une apostrophe. Surtout, la fonction vérifie <b>si le mot qui suit est un verbe</b>, auquel cas, elle ajoute une apostrophe. Un mot appartenant à une liste peut séparer “quelle(s)” du verbe.</p>
<p>Cependant, <b>si le verbe est « être », la règle ne sélectionne pas</b>, car elle ne peut arbitrer. Ex. :</p>
<p>Je sais quelle est votre couleur préférée.</p>
<p>Je crois qu'elle est au travail.</p>
<p>Si « n’en » ou « n’y » s’interposent entre « quelle » et le verbe être, la règle sélectionne quand même.</p>
<p><b>Adjectif indéfini validé</b>
<ul>
<li>Si “quelle”, ou “quelles” sont précédés par un des mots suivants (ou les mêmes avec l’initiale en majuscule) :
</ul></p>
<p style="text-align: center;">à, avec, chez, contre, dans, de, en, entre, n’importe, par, parmi, sais, sait, sous, sur, vers</p>
<p><ul>
<li>ou si “quelle”, ou “quelles” sont précédés par “[tT]elle(s)” et suivi par une ponctuation,
<li>ou si “quelle”, “quelles”, “Quelle” ou “Quelles” sont suivis par : autre, autres, que, qu’
</ul></p>
<p>alors le mot n’est pas sélectionné.</p>
<p><b>Subordonnée validée</b>
<ul>
<li>Si “quelle”, “quelles”, “Quelle” ou “Quelles” sont précédés par un des mots suivants (ou les mêmes avec l’initiale en majuscule) :
</ul></p>
<p style="text-align: center;">afin, ainsi, attendu, après, autant, avant, autre, autres, bien, c’est, ce, condition, contraire, dès, est-ce, façon, façons, même, mêmes, mesure, mieux, moins, parce, plus, plutôt, "pour peu", quoi, sans, surtout, "surtout,", tant, tel, tellement, où, voici, voilà</p>
<p><ul>
<li>ou sont suivis par une ponctuation parmi [.?,!;] ou "qui" ou un des pronoms suivants :
<p style="text-align: center;">en, la, le, me, se, te, les, leur, lui, ne, nous, vous, y, l’, m’, n’, s’, t’</p>
<li>ou sont suivis par par un verbe,
</ul></p>
<p>alors la fonction ajoute une apostrophe entre “qu” ou “Qu” et “elle” ou “elles”.</p>

[F1]
warning
<b>[A][F1] Virgule suivie par un mot avec initiale en maj. (-> point)</b><br/>
<b>[Respecter la casse] est cochée</b><br/>
<b>La fonction <i>Ponct1</i> est mise en oeuvre</b><br/>
<b>Mode automatique obligatoire puis [Voir ce qui a changé]</b>
<p>La règle vise à remplacer par un point une virgule suivie par un mot avec initiale en maj.</p>
<p>Le mot avec initiale en maj. ne doit pas être un nom propre, ni appartenir à un fichier des noms propres qui sont également des mots communs. Ex. : Paris. Il ne peut pas être un mot composé dont la 2<sup>e</sup> partie commence par une maj.</p>
<p>Le mot ne peut pas être : Altesse, Chef, Dieu, Docteur, Éminence, Excellence, Jésus, Madame, Mademoiselle, Maître, Majesté, Miss, Monseigneur, Monsieur, Président(e), Professeur, Révérend, Seigneur, Sir(e).</p>
<p>Le mot avec initiale en maj. peut être une voyelle isolée parmi “A” si elle est suivie par “-t”, À ou “Y”. Il peut être une consonne isolée parmi C, D, J, L, M, N, S, T ou V si elle est suivie par une apostrophe. Également à condition d’être suivi par une apostrophe, le mot peut être :</p>
<p style="text-align: center;">Qu, Aujourd, Lorsqu, Puisqu, Quelqu, Quoiqu</p>
<p>La regex ne sélectionne pas deux mots avec initiale en maj. reliés par “de” ou “du”. Ex. : Gare du Nord, Arc de Triomphe. Elle ne sélectionne pas non plus une succession de mots avec initiale en maj. Ex. : Galeries Lafayette.</p>
<p>La regex ne sélectionne pas une suite de mots avec initiale en maj. suivis par une virgule. Ex. : la tour Eiffel, Castel, Régine, Fouquet’s.</p>
<p>La règle ne sélectionne pas à l’intérieur des balises, ni à l’intérieur des commentaires dans les styles embarqués.</p>

[F2]
warning
<b>[A][F1] (TEST) Espace suivi d’un mot avec initiale en maj. (-> point avant)</b><br/>
<b>[Respecter la casse] est cochée</b><br/>
<b>La fonction <i>First</i> est mise en oeuvre</b><br/>
<b>Mode automatique obligatoire puis [Voir ce qui a changé]</b>
<p>La règle sélectionne notamment un mot avec une initiale en maj. suivie par une ou plusieurs min., à condition de ne pas être suivie par un trait d’union et de se terminer par une rupture de mot. Cela permet d’éviter les noms propres composés comme “Maisons-Laffitte”. Le mot peut cependant être suivi par un tiret suivi d’un pronom personnel sujet (ex. : “Faut-il y aller ?”), avec un possible “t” euphonique.</p>
<p>Elle sélectionne aussi une lettre maj. parmi “CDJLMNST”, ou un mot parmi “Qu, Aujourd, Lorsqu, Puisqu, Quelqu, Quoiqu” suivis par une apostr.</p>
<p>Elle sélectionne enfin une maj. isolée parmi “ÀYA” (à condition, pour “A”, d’être suivi par “-t” comme dans : « Blablabla A-t-il terminé ? »).</p>
<p>Le mot doit être précédé d’une espace séc. elle-même précédée par une min. ou un chiffre non précédés par une apostr. Ce dernier point permet d’éviter des chaînes telles que « Fouquet's Paris » ou, dans un titre, « Don’t Lean Out ».</p>
<p><b>La fonction</b> vérifie que le mot est un mot commun grâce au dictionnaire et à un fichier de mots communs sans la plupart des noms, des adjectifs et des conjugaisons de verbes. Dans ce cas, elle insère un point avant l’espace qui précède le mot, qui est donc un mot commun avec une initiale en maj.</p>
<p>La règle évite les balises et les commentaires html.</p>
<p>Le mot ne peut pas être : Altesse, Chef, Dieu, Docteur, Éminence, Excellence, Jésus, Madame, Mademoiselle, Maître, Majesté, Miss, Monseigneur, Monsieur, Président(e), Professeur, Révérend, Seigneur, Sir(e).</p>
<p>Le mot ne peut pas être précédé par : demi-dieu, dieu et déesse.</p>
<p>On considère, dans les lignes qui suivent, une chaîne constituée par une séc. ou une apostrophe suivie par un mot avec une initiale en maj. continuée par une ou plusieurs min. (Ex. : “_Mot” ou “’Mot”). La chaîne est évitée si elle est précédée par :
<ul>
<li>une min. ou un chiffre isolés (ex. évité : “à Bordeaux”)
<li>la, La, le, Le, les, Les, de, De, du, Du, mon, son ton, notre, votre, leurs, ce, ces, cet, cette, que, qui, rue, place, lac, porte, chez, vers, selon, pour, par, tour, saint, the, a, an, and (ex. évité : “la tour Eiffel”)
<li>un de ces mots lui-même éventuellement précédé d’une apostrophe : un, Un, une, Une, à, après, avenue, en, au, aux, entre (ex. évité : l’avenue Tonneau).
</ul></p>
<p>Si la chaîne est prolongée par une séc. suivie par un autre mot avec une initiale en maj., avec, éventuellement intercalé, “de, du, et, ou, au, aux”, le prolongement n'est pas sélectionné non plus. Ex. évité : ”les Galeries Lafayette”. Ni “Galeries” ni le prolongement “Lafayette” ne sont sélectionnés. Autre ex. “la Gare du Nord”. Ni “Gare” ni le prolongement “Nord” ne sont sélectionnés.</p>
<p>Considérons enfin (pour une raison technique tenant à l’endroit où on démarre la recherche dans une branche) une chaîne constituée par une séc. une inséc. ou le car. > suivis par un mot avec une initiale en maj. continuée par une ou plusieurs min. mot obligatoirement prolongé comme ci-dessus (ex. évité : <balise>Gare du Nord).</p>

[F4]
warning
<b>[A][F] Séparer deux mots collés (y c. élisions)</b><br/>
<b>[Respecter la casse] est cochée</b><br/>
<b>La fonction <i>MotsCollés (y c. élisions) V3</i> est mise en oeuvre</b><br/>
<b>Mode automatique obligatoire puis [Voir ce qui a changé]</b>
<p>L’objectif est de trouver les mots du texte inconnus du dico, puis de voir si une coupure dans ce mot permet de créer deux mots présents dans le dico.</p>
<p>La règle sélectionne les mots de 2 caractères minimum : min., apostr. et tiret (mot composé). Les noms propres ne sont donc pas sélectionnés, ni les mots en maj., ni les mots possédant une lettre issue d’un alphabet étranger. Seul mot faisant exception : “Tues”, à condition de ne pas être suivi par une virgule.</p>
<p>Le mot ne peut pas commencer par une lettre parmi “cdjlmnst” ou par « qu », « lorsqu », « puisqu » ou « quoiqu », suivis d’une apostr. puis d’une min. : dans « l’amour », seul amour est sélectionné.</p>
<p>Le mot ne peut pas se terminer par « ’s » (ex. : no man’s land).</p>
<p>La règle ignore les mots commençant par un des préfixes figurant dans cette liste :</p>
<p>anti, auto, contre, entre, infra, intra, hyper, maxi, mini, multi, néo, pro, post, ré, sub, sup, super, supra, sur, télé, ultra</p>
<p>Elle ignore également les mots suivants : alles, amigo, ap, bagagerie, bécotage, best, blocks, chômedu, comanche, den, dispo, don’t, ducon, epub, mein(e), mister, music, my, noster, plop, private, rapidos, signora, team, y’a, yes, you.</p>
<p>Inversement, bien que figurant au dico, le mot « lune » est forcé de suivre la boucle, afin de bénéficier des précautions sur l’élision décrites plus loin (lune => l’une sauf si le mot est précédé par un article).</p>
<p>Le mot ne doit pas être à l’intérieur d’une balise, ni précéder la balise <i>body</i>.</p>
<p>Si le mot est précédé par un article (« le », « la », « les », « un », « une », « de », « des », « du », article en maj. partiellement ou en totalité autorisé), la règle transmet l’article à la fonction en même temps que le mot.</p>
<p><b>La fonction</b></p>
<p>La fonction ne transforme pas les mots qui sont dans le dico, à l’exception de “tues” et “Tues”, lesquels sont sélectionnés sous certaines conditions afin d’éviter des faux positifs. Ils sont décollés en “tu es” et “Tu es”.</p>
<p>Si le mot n’est pas dans le dico, la fonction coupe le mot en deux et vérifie si les 2 nouveaux mots y figurent. La fonction déplace progressivement la frontière entre les deux mots en re-testant à chaque fois leur présence dans le dico.</p>
<p>a, à, ô et y sont les seules lettres autorisées pour les mots d'une seule lettre (en tête ou en fin du mot). Entre autres, la partie en exposant de M<sup>lle</sup>, entre une paire de balises <i>sup</i>, n’est pas coupée en deux, « l » et « le ».</p>
<p>Si la 1<sup>re</sup> lettre du mot est parmi “cdjlmnst” ou si le mot commence par « qu » et que la 2<sup>e</sup> (ou 3<sup>e</sup> pour qu) lettre est une voyelle, le décollement consiste à mettre une apostr. (élision). La vérification dans le dico doit valider le nouveau mot. La création de l’élision dépend de la transmission ou non d’un article par la regex :</p>
<p><b>Conditions pour créer l'élision en début du mot sélectionné</b></p>
<p>c, d, j, m, n, s, t ou qu + voyelle : si précédé par aucun des articles</p>
<p>l + voyelle : si précédé par aucun des articles sauf « de » ou « De » (ex. : de lamour).</p>
<p><b>Élision à l’intérieur du mot sélectionné</b></p>
<p>Si la fonction échoue à créer 2 mots validés par le dico entre la 2<sup>e</sup> et l'avant-dernière lettre du mot sélectionné (inconnu du dico), et si le 1<sup>er</sup> mot est validé et que le 2<sup>e</sup> commence par une lettre parmi “cdjlmnst” suivie par une voyelle, la fonction crée l’élision sur le 2<sup>e</sup> mot pour vérifier si ce nouveau mot est validé par le dico. Ainsi, “livresdimages” devient “livres d’images”.</p>
<p><b>Vérification du résultat</b></p>
<p>La regex sélectionne les mots de 2 car. minimum, ce qui n’a pas de signification puisque la présence ou non du mot dans le dico n’est pas encore testée. Pour la même raison, on ne peut pas progresser pas à pas. Il faut obligatoirement faire [<i>Remplacer tout</i>] puis [<i>Voir ce qui a changé</i>]. Dans cette fenêtre, on peut alors annuler les changements, ou ne modifier que quelques résultats tout en validant les autres, comme expliqué dans le <i>Guide</i>.</p>
<p>Ainsi, le mot « platesformes » sera décollé en « plates formes ». Le contexte indiquera s’il faut les recoller en supprimant le « s ».</p>
[F5]
warning
<b>[A][F] Tirets excédentaires (-> suppr)</b><br/>
<b>[Respecter la casse] est cochée</b><br/>
<b>La fonction <i>Tirets excédentaires</i> est mise en oeuvre</b><br/>
<b>Mode automatique obligatoire puis [Voir ce qui a changé]</b>
<p>L’objectif est de trouver les mots du texte avec au moins un trait d’union et inconnus du dico, puis de voir si supprimer un voire les deux traits d’union crée un mot présent dans le dico.</p>
<p>L’expression sélectionne les mots composés de deux ou trois parties séparées par un trait d’union. Chaque partie ne peut être composée que de min. françaises et d'apostr., et est capturée pour être transmise à la fonction. Les noms propres ne sont donc pas sélectionnés, ni les mots composés à l'intérieur de phrases en maj., ni ceux contenant un chiffre. Si le mot composé commence une phrase, il ne sera pas sélectionné non plus, à cause de la maj. initiale.</p>
<p>Le mot composé est bordé par une limite de mot et ne peut pas être précédé ni suivi d'un tiret, pour éviter, par ex. : « Mon prénom s'épelle G-e-o-r-g-e-s », ou « boum-boum-boum-badaboum ».</p>
<p>Le mot composé ne peut pas être situé à l'intérieur d'une balise, ni précéder la balise <i>body</i>.</p>
<p>Si le mot composé n’est pas dans le dico, la fonction supprime un voire deux traits d’union pour vérifier si cela crée un mot présent dans le dico. Le mot « par-dessus » étant présent dans le dico, la fonction ne le modifie pas. Si le mot est « plate-formes », sans « s » à « plate », la fonction supprime le trait d’union.</p>
<p><b>Vérification du résultat</b></p>
<p>La regex sélectionne les mots avec un trait d’union et sans maj., ce qui n’a pas de signification puisque la présence ou non du mot dans le dico n’est pas encore testée. En mode auto, Il est recommandé de cliquer sur [<i>Voir ce qui a changé</i>]. Dans cette fenêtre, on peut alors annuler les changements, ou ne modifier que quelques résultats tout en validant les autres, comme expliqué dans le <i>Guide</i>. Dans la télécommande du pas à pas, le libellé “Voir le remplacement (survol)” devient rouge lorsque le remplacement est différent de la chaîne remplacée. On visualise le remplacement proposé en survolant le libellé avec la souris.</p>

[G2]
book
<b>[C] Compter appels de note + liens de retour texte (-> nb pair)</b>
<p><b>Attention :</b> si le livre contient dans le texte un renvoi vers une autre partie (ex. : <i>voir chapitre 8</i>, avec un lien), ce renvoi sera compté.</p>
<p>La recherche compte les appels de notes à l’intérieur du texte et les renvois au texte à l’intérieur des notes. Elle doit donner un nombre pair dont la division par 2 a pour résultat le nombre de notes, sauf en cas de renvoi du texte vers une autre partie du texte.</p>
<p>Lorsque le nombre de notes n’est pas trop élevé, on peut parcourir les notes en exécutant la recherche pas à pas.</p>
<p>Tous les appels de note ont un point commun malgré la diversité des processus de fabrication : un lien vers la note, matérialisé par une balise “a”. Dans la note, on trouve également un lien permettant de retourner au texte. Une table des matières html d’un epub2 et le fichier de navigation obligatoire des epub3 possèdent aussi de tels liens. Enfin, on peut trouver des liens possibles vers l’extérieur du livre, notamment vers le site Internet de l’éditeur ou de l’auteur.</p>
<p>L’objectif de la règle est de compter (éventuellement de parcourir) tous les liens, sauf si la paire de balises “a” est directement encadrée par des balises “li֨” ou “ol” (fichier de navigation epub3) ou une paire de balises “p” ou div (table des matières html epub2). On évite également les liens dont la propriété href commence par http (liens vers l’extérieur).</p>
<p>La paire de balises “a” contient un numéro, qui peut être encadré par des crochets, des parenthèses ou des accolades, suivis par des éventuels espaces, le tout éventuellement encadré par des balises (<i>span, sup</i> ou autres).</p>

[G3]
book
<b>Caractères n’appartenant pas au jeu fr</b><br/>
<b>[Pas à pas] obligatoire</b>
<p>Un car. à l’intérieur d’une paire de balises ayant l’attribut lang n’est pas sélectionné.</p>
<p>Tout car. sorti par cette regex ne doit pas forcément être modifié. <b>C’est une exploration du livre et de ses particularités</b>. Si le livre contient des phrases en espagnol, par ex., elle peut sortir des caractères tels ¡ ou ¿ et attirer votre attention sur ces passages. C’est l’occasion de vérifier que la balise associée possède l’attribut lang="es" (c’est important pour la vérif. d’orthographe). De même, des noms de personnages de romans nordiques peuvent contenir des car. spéciaux.</p>

[G4]
warning
<b>(OPTIONNELLE) Remplacer les inséc. par des fines</b>
<p><b>Après exécution de cette règle, tous les mots qui suivent ou précèdent les inséc. fines ne sont plus reconnus par le dico.</b> Celui-ci ne reconnait pas ce caractère comme séparateur et l'intègre au mot.</p>
<p><b>Il faut que la police de la liseuse possède ce caractère, ce n’est pas certain.</b></p>
<p>À faire, ou pas, selon votre conception. Cette regex suppose que les inséc. ont été placées précédemment : après le guillemet français ouvrant, avant les autres ponct. doubles (point-virgule, point d’interrogation, point d’exclamation, deux-points), et en séparateur de milliers pour les nombres. La chaîne sélectionnée ne doit pas faire partie d’une balise.</p>