View Single Post
Old 12-09-2009, 08:25 PM   #2
netseeker
sleepless reader
netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.
 
netseeker's Avatar
 
Posts: 4,770
Karma: 615335
Join Date: Jan 2008
Location: Germany, near Stuttgart
Device: Sony PRS-505, PB 360° & 302, nook wi-fi, Kindle 3
Die (X)HTML-Spezifikation, auf welcher ePub in Teilen basiert, schreibt die Ersetzung aller nicht im Zeichenvorrat des von der (X)HTML-Datei verlangten Zeichensatzes vor. (Bei iso-8859-1 muss z.B. das Eurosymbol durch den HTML-Code ersetzt werden, weil das Eurosymbol da nicht als Zeichen definiert ist) Zusätzlich gibt es reservierte und auch verbotene Zeichen (<, >, &, ' und ja eigentlich auch das doppelte Anführungszeichen oben "). Da selbst bei direkter Angabe des gewünschten Zeichensatzes in einer (X)HTML-Datei nicht garantiert ist, dass die Software, welche den Inhalt darstellt (im Regelfall hier ein Browser, bei ePub ein ePub-Reading-System), den gewünschten Zeichenvorrat unterstützt, gibt es für fast alle "erweiterten Zeichen" die sog. HTML-Codes "&irgendwas;".

Es ist mit der Ausnahme von Dateien in einem Unicode-Zeichensatz im Lauf der Jahre zum Quasi-Standard geworden möglichst immer die HTML-Codes zu verwenden um Probleme mit nicht unterstützten Zeichensätzen zu vermeiden.

Weitere Details hier im SelfHtml.

Also lange Rede kurzer Sinn: Bis auf die explizit reservierten 5 Zeichen muss man keine HTML-Codes verwenden und ' sowie " werden selbst bei Verletzung dieser Regel eigentlich von jeder Software korrekt dargestellt. Benutzt man jedoch keinen Unicode-Zeichensatz, sollte man definitiv für alle Sonderzeichen mit den HTML-Codes arbeiten um häufig auftretende Darstellungsprobleme zu vermeiden.

Last edited by netseeker; 12-10-2009 at 05:11 AM.
netseeker is offline   Reply With Quote