After adding <0x00> to the subroutine removeInvalidChars and rerunning the script for Duden the entry generated is:
Code:
<ar>
<head><k>a</k></head><def><sup>i.</sup><blockquote><span><span><b>a, </b><b>A </b>das; - (UGS.: -s), - (UGS.: -s) [mhd., ahd. a]: <b>1.</b> erster Buchstabe des Alphabets: <i>ein kleines a, ein großes A; </i> <i>eine Broschüre mit praktischen Hinweisen von A bis Z (unter alphabetisch angeordneten Stichwörtern); </i> <b>R </b>wer A sagt, muss auch B sagen (wer etwas beginnt, muss es fortsetzen u. auch unangenehme Folgen auf sich nehmen); <sup>*</sup><b>das A und O, </b>(SELTENER:) <b>das A und das O </b>(die Hauptsache, Quintessenz, das Wesentliche, Wichtigste, der Kernpunkt; urspr. = der Anfang und das Ende, nach dem ersten [Alpha] und dem letzten [Omega] Buchstaben des griech. Alphabets); <sup>*</sup><b>von A bis Z </b>(UGS.; von Anfang bis Ende, ganz und gar, ohne Ausnahme; nach dem ersten u. dem letzten Buchstaben des dt. Alphabets). <b>2.</b> ‹das; -, -› (MUSIK) sechster Ton der C-Dur-Tonleiter: <i>der Kammerton a, A.</i> </span></span><span></span></blockquote>
<sup>ii.</sup><blockquote><span><span><small><sup>1</sup></small><b>a</b>= a-Moll; Ar.</span></span><span></span></blockquote>
<blockquote><span><span><small><sup>2</sup></small><b>a</b> ‹Präp.› [ital. a < lat. ad = zu]: auf, mit, zu (in ital. Fügungen, z.*B. a*conto, a*tempo).</span></span><span></span></blockquote></def>
</ar>
Note that the '>' symbol is still formatted as the html-codepoing '<'. is this also not displayed properly, just as '''?
@Getkey Could you test
Duden of Nov15th2021?