Ich habe zufällig herausgefunden, dass man durch die Bearbeitung der Rechtschreibdateien, die Sigil verwendet, bessere Vorschläge für mit OCR erfasste Texte anzeigen kann.
Sigil verwendet für die Rechtschreibprüfung Hunspell-Wörterbücher, die u.a. auch in LibreOffice verwendet werden. Um bessere Vorschläge für Wörter zu bekommen, die typische OCR-Fehler enthalten (z.B. m anstatt von
rn ) muss man nur einen Block in der AFF-Datei Datei mit einem Texteditor, z.B. Notepad+, bearbeiten.
Das funktioniert wie folgt:
Zuerst muss die Ordner finden, in denen Sigil nach Wörterbüchern sucht. Das geht am einfachsten, wenn
+R drückt, die folgenden symbolischen Pfade einfügt und dann die Eingabetaste drückt.
Code:
%ProgramFiles%\Sigil\hunspell_dictionaries
Code:
%LOCALAPPDATA%\sigil-ebook\sigil\hunspell_dictionaries
Dann muss man die jeweilige AFF-Datei suchen und in einen anderen Ordner zum Bearbeiten kopieren. (Für Deutsch ist das normalerweise de_DE.aff oder de_DE_OLDSPELL.aff.)
In der AFF-Datei muss man den folgenden Block suchen und bearbeiten:
(Die erste Zeile definiert die Anzahl der folgenden Einträge, die das Format REP {alt} {neu} haben müssen.)
Ich habe diesen Abschnitt wie folgt geändert:
Mit diesen Änderungen bekommt man u.a. folgende Vorschläge:
heiden => beiden statt Heiden
hindem => hindern statt indem
Ich habe der Einfachheit halber aktualisierte Versionen von de_DE.aff und de_DE_OLDSPELL.aff angehängt.