View Single Post
Old 11-25-2021, 05:29 PM   #1
Moonbase59
Zealot
Moonbase59 can program the VCR without an owner's manual.Moonbase59 can program the VCR without an owner's manual.Moonbase59 can program the VCR without an owner's manual.Moonbase59 can program the VCR without an owner's manual.Moonbase59 can program the VCR without an owner's manual.Moonbase59 can program the VCR without an owner's manual.Moonbase59 can program the VCR without an owner's manual.Moonbase59 can program the VCR without an owner's manual.Moonbase59 can program the VCR without an owner's manual.Moonbase59 can program the VCR without an owner's manual.Moonbase59 can program the VCR without an owner's manual.
 
Moonbase59's Avatar
 
Posts: 111
Karma: 196896
Join Date: Oct 2021
Location: Germany
Device: Tolino Vision 5, Tolino Tab 8"
Tolino - Deutsche Silbentrennung

Die Tolinos sind zwar schöne Geräte, die mitgelieferte Silbentrennung verdirbt aber – zuminest mir – ziemlich den Lesespaß. Zu diesem Thema gab es schon mehrere Ansätze, z.B. Peripathetics Customizing the Tolino und Sentos Silbentrennung verbessern (PocketBook), aber keine konnte mich so recht zufriendenstellen.

Ich habe mir darum die aktuelle (2021-11-25) Version der TeX-Silbentrennung dehyph-exptl des dante e.V. (MIT-lizenziert) als Basis genommen, die Wortlisten (Korpusgröße > 500.000 Wörter) und Regeln weiter ausgebaut, neu kompiliert, in LaTeX getestet und dann in die Formate für Hunspell (Hyphen) und Hyphenator konvertiert und weiter für den Tolino angepasst.

Herausgekommen ist eine, wie ich finde, für algorithmische silbenbasierte Trennung ganz brauchbare Version – in jedem Fall deutlich besser als das, mit dem die Tolino-Allianz uns "verwöhnt".

Die Tolinos verwenden ein – üblicherweise automatisch umgeschaltetes – Konglomerat von Reader Engines, bestehend aus dem Adobe RMSDK, Readium und Lites ("Tolino-Leseerfahrung Beta") und eine Menge veralteter Open-Source-Software wie z.B. Hunspell- (Hyphen-)kompatible Silbentrennungsbibliotheken ("hyph_de.dic") und das Hyphenator-Javascript mit "de.js".

Ganz klar ist mir nicht, ob und wann der Hyphenator tatsächlich verwendet wird, mit Readium bzw. Lites als Engine konnte ich keine Silbentrennung beobachten. Das scheint lediglich mit dem Adobe RMSDK und der "hyph_de.dic" gut zu funktionieren. Weiß hier evtl. jemand Genaueres?

Sicherheitshalber habe ich jedenfalls auch neue Patterns für den Hyphenator erzeugt. Als Testgerät benutze ich einen Tolino Vision 5 mit Softwarestand 14.2.0.

Die veraltete Software im Tolino erlaubt leider nicht die modernen Compound- und NOHYPHEN-Funktionen in "hyph_de.dic" (wie sie etwa Sento für das PocketBook benutzt), daher musste ich einige "Verrenkungen" einbauen, damit es halbwegs gut funktioniert. Die im Tolino eingesetzte Adobe-Engine erlaubt augenscheinlich nur die Verwendung des Level 2, was die Möglichkeiten stark einschränkt.

Die "Zwei-Buchstaben-Silbentrennung" wie etwa in "Be-darf" oder "Allgäu-er" habe ich drastisch reduziert, da sie den Lesefluss eher hemmt und zu deutlich mehr Trennstellen führt. Ich finde, eine Silbentrennung ab drei Zeichen Länge ist für den Blocksatz noch vertretbar, zumal aus unerfindlichen Gründen Absätze mit Erstzeileneinzug sowieso nicht getrennt werden (warum?).

Tipp: Ein wahlloses Ändern der Parameter …HYPHENMIN in "hyph_de.dic" bzw. leftmin und rightmin in "de.js" bringt nicht viel. Die zugrundeliegenden Silbentrennungsmuster müssten für jeden Fall neu berechnet werden. Eine Anpassung nach unten (z.B. auf 2/2) würde gar nicht funktionieren, da die "kurzen" Muster nicht mehr in den Tabellen enthalten sind.

Der verwendete Korpus und die errechneten Silbentrennmuster sind m.E. recht gut – hier noch einmal ein herzliches Dankeschön an die "Trennmustler" des dante e.V.! –, aber es gibt natürlich keine vollumfängliche Lösung. Sprache lebt! Einige Grenzfälle und falsche Trennungen bei Eigen- und Ortsnamen sind immer möglich. Aus Performancegründen wird auch eine Reihe einheitlicher Präfixe und Suffixe verwendet, sodass nicht immer die vom Duden empfohlene Trennung erfolgen wird, aber (hoffentlich) immer eine zulässige.

Lasst mich wissen, wie euch diese Variante der Silbentrennung gefällt und meldet bitte auch Fehler.

Installation

1. Angehängtes Archiv entpacken. Es enthält die Dateien "hyph_de.dic" und "de.js".

2. Tolino über USB mit dem PC verbinden und ein Backup der vorhandenen Dateien ".tolino/hyphenator/patterns/de.js" und ".tolino/hyphenDicts/hyph_de.dic" anfertigen (oder diese umbenennen). Achtung: Der Ordner ".tolino" (MIT führendem Punkt!) ist (zumindest für Android und Linux) unsichtbar, ihr müsst also zuerst die Anzeige unsichtbarer Dateien und Ordner aktivieren (im Linux-Dateimanager üblicherweise mit Strg+H).

3. Datei "de.js" aus dem Archiv kopieren nach ".tolino/hyphenator/patterns/de.js". Anschließend unbedingt schreibschützen ("read-only machen"), da der Tolino sie sonst bei jedem Neustart wieder durch seine eigene schlechte Version ersetzt! Im Linux-Dateimanager dazu Rechtsklick → Eigenschaften → Zugriffsrechte, dann für Eigentümer/Gruppe/Welt jeweils "Nur lesen" einstellen.

4. Datei "hyph_de.dic" aus dem Archiv kopieren nach ".tolino/hyphenDicts/hyph_de.dic". Anschließend unbedingt schreibschützen ("read-only machen"), da der Tolino sie sonst bei jedem Neustart wieder durch seine eigene schlechte Version ersetzt! Im Linux-Dateimanager dazu Rechtsklick → Eigenschaften → Zugriffsrechte, dann für Eigentümer/Gruppe/Welt jeweils "Nur lesen" einstellen.

5. Tolino "auswerfen" (vom USB-Gerät trennen mittels Betriebssystem-Funktion) – nicht einfach Kabel ziehen!

6. Abwarten, bis der Tolino nach neuen Büchern gesucht hat, dann neu starten. Beim Shine und Vision 5 geschieht das durch längeres Drücken der Power-Taste. Es erscheint dann ein Menü, auf dem man "Ausschalten" bzw. "Neu starten" wählen kann. "Neu starten" reicht an dieser Stelle.

7. Zur Kontrolle ggf. den Tolino noch einmal mit dem PC verbinden und überprüfen, ob die beiden kopierten Dateien noch vorhanden sind (Größe/Datum) oder vom Tolino durch seine Version ersetzt wurden.

8. Deutsches E-Book im EPUB-Format öffnen und funktionierende Silbentrennung überprüfen. Achtung: Die sehr umfangreichen deutschen Silbentrennungsmuster verzögern das Laden bzw. die Neuanzeige nach Schriftgrößenänderung um ein paar Sekunden, nicht erschrecken! Das anschließende – hoffentlich erfreuliche – Leseerlebnis sollte dafür entschädigen. Ob der Tolino fertig ist, erkennt man am Neuaufbau der Seite (es wird ja zuerst hohe Geschwindigkeit durch das Laden eines im Cache gespeicherten Screenshots vorgegaukelt …) oder daran, dass er auf ein Antippen in der Displaymitte mit der Anzeige der Menüs reagiert.

Viel Freude und Lesespaß damit!
Attached Files
File Type: zip tolino-hyph_de.zip (236.4 KB, 588 views)
Moonbase59 is offline   Reply With Quote