Register Guidelines E-Books Today's Posts Search

Go Back   MobileRead Forums > Non-English Discussions > Deutsches Forum

Notices

Reply
 
Thread Tools Search this Thread
Old 11-17-2009, 05:01 PM   #1
polyfragmentiert
Groupie
polyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshes
 
polyfragmentiert's Avatar
 
Posts: 181
Karma: 14258
Join Date: Oct 2009
Location: Kiel, Germany
Device: SONY PRS-T1, bald tolino vision 3 HD
Wie wird gut ausgeglichener Blocksatz (in EPUBs) realisiert?

Ahoi-hoi,

bin gerade hier im deutschen Forum auf eine (lange abgeschlossene) Umfrage zum Thema "Block- oder Flattersatz?" gestolpert und frage mich ganz allgemein, wie gut der Blocksatz bei EPUBs und den Geräten eigentlich sein mag? Wenn ich es richtig verstehe, basiert das Format auf XML bzw. die Ausgabe auf XHTML. Zumindest Browser können ohne Hilfsmittel wie Javascript-/PHP-/Python-/...-basierte Bibs nicht automagisch trennen.

Hat jemand technische Info wie das in Readern gelöst wird? Ich bekomme demnext zum Beispiel einen Cybook Opus und mich würde das schon interessieren. Ich hab' mich noch nicht mit der Erstellung von ebooks befasst, mir spukte die Frage halt als Neuling überraschend im Kopf herum. Vielleicht kennt sich ja jemand aus oder kann mich weiter verweisen.

Edit: ich schau' mich natürlich auch selbst nach der Antwort um und checke mal Wikipedia und das Wiki hier ab.

Wie ich sehe, scheint das Thema "Silbentrennung" doch komplizierter zu sein als zunächst gedacht und ist nicht nur auf Geräteseite anzusiedeln.

Last edited by polyfragmentiert; 11-18-2009 at 06:00 AM. Reason: Edit zur eigenen Recherche hinzugefügt
polyfragmentiert is offline   Reply With Quote
Old 11-20-2009, 03:52 PM   #2
Yoshi 1080
Addict
Yoshi 1080 doesn't litterYoshi 1080 doesn't litterYoshi 1080 doesn't litter
 
Posts: 303
Karma: 204
Join Date: Oct 2009
Location: Germany
Device: iPad, iPhone, Mac
Browser können auch ohne Hilfsmittel Silben korrekt trennen, wenn man ihnen per shy-Tag (&shy sagt, wo sie trennen sollen. Theoretisch wäre es also denkbar, dass bei der Konvertierung ins ePub-Format die Soft-Hyphens einfach direkt in den Quelltext geschrieben werden.

Da die Silbentrennung aber laut einigen Posts unterschiedlich gut/schlecht in den Readern umgesetzt ist, vermute ich eher, dass sie das anhand eines eingebauten Wörterbuchs selbst machen. Offenbar wird für eine gute Silbentrennung eine hohe Rechenleistung gefordert (habs glaube ich sogar hier im Forum gelesen). Sollte das mit dem Wörterbuch stimmen, würde sich aber die Frage stellen, wie das mit fremdsprachigen Texten funktioniert. Vielleicht gibts dafür ja auch einen Algorithmus.
Yoshi 1080 is offline   Reply With Quote
Advert
Old 11-20-2009, 04:17 PM   #3
mtravellerh
book creator
mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.
 
mtravellerh's Avatar
 
Posts: 9,635
Karma: 3856660
Join Date: Oct 2008
Location: Luxembourg
Device: PB360°
Das mit den "shy"-Tags klappt so bei Stanza. Bei ADE gibt's meines Wissens nach nur interne Parameter, auf die man nicht direkt eingreifen kann.
mtravellerh is offline   Reply With Quote
Old 11-20-2009, 05:03 PM   #4
polyfragmentiert
Groupie
polyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshes
 
polyfragmentiert's Avatar
 
Posts: 181
Karma: 14258
Join Date: Oct 2009
Location: Kiel, Germany
Device: SONY PRS-T1, bald tolino vision 3 HD
Quote:
Originally Posted by Yoshi 1080 View Post
(...) vermute ich eher, dass sie das anhand eines eingebauten Wörterbuchs selbst machen. (...)
Das macht Sinn, vermute ich auch.

Quote:
Originally Posted by Yoshi 1080 View Post
(...) Sollte das mit dem Wörterbuch stimmen, würde sich aber die Frage stellen, wie das mit fremdsprachigen Texten funktioniert. Vielleicht gibts dafür ja auch einen Algorithmus.
Ich denke, damit die Software weiß, um welche Sprache es sich handelt, muss hier wieder der Ersteller ran. In XHTML, worauf ePub bei der Ausgabe wohl setzt, kann der Ersteller, neben entsprechenden Metatags für das gesamte Dokument, auch Teilstrings per lang-Tag kennzeichnen.
polyfragmentiert is offline   Reply With Quote
Old 11-21-2009, 06:30 AM   #5
Almandin
Member
Almandin doesn't litterAlmandin doesn't litterAlmandin doesn't litter
 
Posts: 13
Karma: 230
Join Date: Nov 2009
Device: none
Quote:
Originally Posted by Yoshi 1080
Offenbar wird für eine gute Silbentrennung eine hohe Rechenleistung gefordert
Nein, auch auf meinem schon mehrere Jahre alten PDA mit Palm-OS läuft ein Leseprogramm (Weasel-Reader), das eine erstaunlich gute Silbentrennung hat, die man auf verschiedene Sprachen einstellen kann. Der raffinierte Trennalgorithmus, der dort benutzt wird, stammt ursprünglich aus dem Textsatzprogram TeX (entwickelt wurde er schon Anfang der 1980er Jahre von Franklin Mark Liang), man braucht da auch nicht etwa ein komplettes Wörterbuch, sondern es reicht eine relativ kurze Trennmustertabelle, mit der man dann etwa 90% der zulässigen Trennstellen findet, was für einen ausgeglichenen Blocksatz ausreichend ist. Diese Trennmustertabellen sind natürlich sprachabhängig, fürs Deutsche gibt es sogar zwei Trennmuster: alte und neue Rechtschreibung. Auch der FBReader verwendet übrigens diesen Trennalgorithmus.

Eine brauchbare Silbentrennung auf schwachbrüstigen Rechnern gibt es also schon sehr lange, nur interessieren sich offenbar die wenigsten E-Reader-Hersteller dafür, einen ordentlich formatierten Text auf den Bildschirm zu bringen. Sie geben lieber ihr Geld für die Entwicklung von teuren DRM-Lösungen aus.

Ich finde es ziemlich ärgerlich, daß ein Netbook für 250 Euro eine ausgereiftere Textdarstellung hat als ein gleichteures dediziertes Lesegerät: Blocksatz, Silbentrennung, Benutzung verschiedener Fonts, Unicode-Fähigkeit - all dies sollte für E-Ink-Reader eine Selbstverständlichkeit sein, ist es aber leider noch nicht. Mit dem Epub-Addon für den Firefox-Browser wird sogar Sperrsatz korrekt dargestellt, das kann, glaube ich, noch kein einziger E-Ink-Reader.
Almandin is offline   Reply With Quote
Advert
Old 11-21-2009, 07:51 AM   #6
polyfragmentiert
Groupie
polyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshes
 
polyfragmentiert's Avatar
 
Posts: 181
Karma: 14258
Join Date: Oct 2009
Location: Kiel, Germany
Device: SONY PRS-T1, bald tolino vision 3 HD
Hey Almandin,

danke für die Infos!

Quote:
Originally Posted by Almandin View Post
Ich finde es ziemlich ärgerlich, daß ein Netbook für 250 Euro eine ausgereiftere Textdarstellung hat als ein gleichteures dediziertes Lesegerät: Blocksatz, Silbentrennung, Benutzung verschiedener Fonts, Unicode-Fähigkeit (...)
Da stimme ich Dir voll zu. Gerade auf einem kleinen Display finde ich es auch wichtig, die bestmögliche Textdarstellungen zu erreichen. Das beschränkt sich natürlich nicht nur auf kleine Displays, aber mein Opus hat nunmal gerade 125mm Diagonale.

Last edited by polyfragmentiert; 11-21-2009 at 07:59 AM.
polyfragmentiert is offline   Reply With Quote
Old 11-21-2009, 10:10 AM   #7
T_Frain_K
Booyah!
T_Frain_K once ate a cherry pie in a record 7 seconds.T_Frain_K once ate a cherry pie in a record 7 seconds.T_Frain_K once ate a cherry pie in a record 7 seconds.T_Frain_K once ate a cherry pie in a record 7 seconds.T_Frain_K once ate a cherry pie in a record 7 seconds.T_Frain_K once ate a cherry pie in a record 7 seconds.T_Frain_K once ate a cherry pie in a record 7 seconds.T_Frain_K once ate a cherry pie in a record 7 seconds.T_Frain_K once ate a cherry pie in a record 7 seconds.T_Frain_K once ate a cherry pie in a record 7 seconds.T_Frain_K once ate a cherry pie in a record 7 seconds.
 
T_Frain_K's Avatar
 
Posts: 673
Karma: 1753
Join Date: Jul 2009
Location: Austria
Device: Cybook Gen3 // Samsung Galaxy S
Quote:
Originally Posted by Yoshi 1080 View Post
Offenbar wird für eine gute Silbentrennung eine hohe Rechenleistung gefordert
Ich verstehe nicht, warum hier im Forum immer wieder die Rede ist, dass gewisse Funktionen eines Text-Viewers "hohe Rechenleistung" benötigen sollten. Wir reden immerhin von Geräten, die einen 200-400 MHz-Prozessor verbaut haben. Und die nichts anders zu tun haben, als Text anzuzeigen, vielleicht noch ein paar Bildchen.

Wer´s kann, erinnere sich doch zurück, welche Games er auf einem 200MHz-Rechner alles spielen konnte.
Zum Vergleich: der Boardcomputer eines Space-Shuttles arbeitet mit einem 286er (Falls das noch jemand kennt )
T_Frain_K is offline   Reply With Quote
Old 11-21-2009, 10:18 AM   #8
mtravellerh
book creator
mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.
 
mtravellerh's Avatar
 
Posts: 9,635
Karma: 3856660
Join Date: Oct 2008
Location: Luxembourg
Device: PB360°
Hab auch schon tolle Spiele mit meinem C64 gemacht und noch tollere Musik gemacht! Aber davon mal ganz abgesehen: Stanza macht mit den integrierten ­ Tags beispielsweise die Rechenarbeit kinderleicht. Das könnte ADE auf den diversen Desktops genauso. Beim LRF-Format für den Sony funktioniert es gleich mit Vorformatierung!
mtravellerh is offline   Reply With Quote
Old 11-23-2009, 08:37 AM   #9
polyfragmentiert
Groupie
polyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshes
 
polyfragmentiert's Avatar
 
Posts: 181
Karma: 14258
Join Date: Oct 2009
Location: Kiel, Germany
Device: SONY PRS-T1, bald tolino vision 3 HD
Okay,

nehmen wir mal explizit das Cybook Opus, das ich besitze. Ich hab' bisher hauptsächlich E-Books von Feedbooks im ePub-Format an der Angel. Weiß jemand, ob es Bestrebungen von Bebook gibt, automatische Silbentrennung einzubauen?

Ich sah gestern in einem Buch lediglich, wie in Webbrowsern, Trennung an Bindestrichen, aber ansonsten nichts. Richtig verunstaltete Zeilen hatte ich bis jetzt noch nicht, kann mir aber vorstellen, dass der Textfluss durch Silbentrennung noch etwas sahniger werden könnte.

Und wie auch ein anderer Nutzer hier bereits allgemeiner andeutete, hat das Opus immerhin einen 400MHz-Prozessor. Ist das E-Book kapitelweise in einzelne Ausgabedateien gesplittet, sollte es doch eigentlich keine krassen Verzögerungen geben oder?

Wie seht Ihr das, die Ihr mehr Erfahrung in diesem Bereich habt?
polyfragmentiert is offline   Reply With Quote
Old 11-23-2009, 11:05 AM   #10
mtravellerh
book creator
mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.
 
mtravellerh's Avatar
 
Posts: 9,635
Karma: 3856660
Join Date: Oct 2008
Location: Luxembourg
Device: PB360°
Quote:
Originally Posted by polyfragmentiert View Post

Und wie auch ein anderer Nutzer hier bereits allgemeiner andeutete, hat das Opus immerhin einen 400MHz-Prozessor. Ist das E-Book kapitelweise in einzelne Ausgabedateien gesplittet, sollte es doch eigentlich keine krassen Verzögerungen geben oder?

Wie seht Ihr das, die Ihr mehr Erfahrung in diesem Bereich habt?
Das mit dem kapitelweise Aufsplitten hat an sich einen anderen Grund: Der Sony-Reader kann nämlich hardwarebedingt bei den ePubs nur Textbrocken bis 300 kb unkomprimiert verarbeiten. Deshalb splitten wir die Texte auf, um sonykompatibel zu bleiben (Sony hat übrigens einen weit schwächlicheren Prozessor) Das hat also mit dem Blocksatz nix zu tun! Ich hab allerdings gemerkt, dass mein Cooler durchaus auch schon mal korrekt trennt und die Schusterjungen- und Hurenkinderregelung einhält!
mtravellerh is offline   Reply With Quote
Old 11-23-2009, 11:17 AM   #11
polyfragmentiert
Groupie
polyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshes
 
polyfragmentiert's Avatar
 
Posts: 181
Karma: 14258
Join Date: Oct 2009
Location: Kiel, Germany
Device: SONY PRS-T1, bald tolino vision 3 HD
Quote:
Originally Posted by mtravellerh View Post
Deshalb splitten wir die Texte auf, um sonykompatibel zu bleiben (Sony hat übrigens einen weit schwächlicheren Prozessor) Das hat also mit dem Blocksatz nix zu tun!
Okay, danke für die Info. Aber auch wenn die Aufteilung direkt nichts mit dem Blocksatz beziehungsweise einer möglichen Silbentrennung zu tun hat, wäre das ja kein Nachteil, falls die Silbentrennung mehr Resourcen verbauchen sollte. Kleinere Happen wären dem ja zuträglich.
polyfragmentiert is offline   Reply With Quote
Old 12-14-2009, 03:59 AM   #12
Montyp535
Zealot
Montyp535 began at the beginning.
 
Montyp535's Avatar
 
Posts: 141
Karma: 10
Join Date: Dec 2009
Location: MD
Device: (former) Ebookwise 1150, PB 302, (now) PB 612, PB Touch, HTC DesireS
mh, also mein ebookwise arbeitet ohne Silbentrennung und ich muss sagen, der Blocksatz sieht zu 95 % auch gut aus. Probleme sind nur bei sehr langen Worten am Zeilenende - da wird dann schon mal auf die nächste Zeile umgebrochen. Ansonsten wird das alles mit Wortabständen gemacht - man muss aber dazu sagen, dass die verarbeiteten Dateien "fest" für die Displaygröße erstellt werden, Grundlage ist zwar ein xhtml-Format, aber wie das letztendlich zu den benötigten "imp"s gebaut wird...?
aber ich denke, ein Blocksatz ist weniger von der Rechenleistung abhängig, eher von der Software, die es einstellt.
Montyp535 is offline   Reply With Quote
Old 12-14-2009, 06:20 AM   #13
Marc_liest
Early Adopter
Marc_liest ought to be getting tired of karma fortunes by now.Marc_liest ought to be getting tired of karma fortunes by now.Marc_liest ought to be getting tired of karma fortunes by now.Marc_liest ought to be getting tired of karma fortunes by now.Marc_liest ought to be getting tired of karma fortunes by now.Marc_liest ought to be getting tired of karma fortunes by now.Marc_liest ought to be getting tired of karma fortunes by now.Marc_liest ought to be getting tired of karma fortunes by now.Marc_liest ought to be getting tired of karma fortunes by now.Marc_liest ought to be getting tired of karma fortunes by now.Marc_liest ought to be getting tired of karma fortunes by now.
 
Marc_liest's Avatar
 
Posts: 3,161
Karma: 3534948
Join Date: Oct 2008
Location: hier und da
Device: einige
Der FBREader auf der MM beherrscht eine recht gute Silbentrennung. Je kleiner das Display um so wichtiger. Es sollte allerdings NICHTS mit der "Rechenleistung" zu tun haben.
Marc_liest is offline   Reply With Quote
Reply


Forum Jump

Similar Threads
Thread Thread Starter Forum Replies Last Post
epub und Blocksatz Insider Erste Hilfe 5 07-30-2010 03:01 AM
[360] Wie wird der Deckel befestigt? HermannKoeller PocketBook 14 03-09-2010 04:20 PM
Other Fiction Duller, Eduard: Jesuiten, wie sie waren und wie sie sind german V1 17.07.2009 Insider ePub Books 0 07-17-2009 12:02 AM
Philosophy Nietzsche, Friedrich: Ecce homo. Wie man wird, was man ist ist. v1 23 may 2009 german stahanovez Kindle Books 0 05-23-2009 01:53 PM
Philosophy Nietzsche, Friedrich: Ecce homo. Wie man wird,... v1.1 24 may 2009 german stahanovez ePub Books 0 05-23-2009 01:52 PM


All times are GMT -4. The time now is 11:25 PM.


MobileRead.com is a privately owned, operated and funded community.