... es liegt wohl weniger an mir als an den "Machern" des Projekts Tesseract, die mit Sicherheit bereits sehr viel Arbeit dort hinein gesteckt haben

. Wenn du dich daran versuchen willst:
http://code.google.com/p/tesseract-ocr/ gibt einen guten Überblick, und in den Downloads kannst du gleich die die Programme und Trainingsbibliotheken herunter laden. Die Bibliothek für Fraktur ist deu-frak.traineddata.gz.
Das Problem liegt wohl nicht nur an "unsauberen" Scans, sondern auch an den verschiedenen Varianten der Fraktur. Was ich so gelesen habe, muss manchmal für ein en neuen Frakturtyp intensiv trainiert werden (was Zeitaufwand bedeutet). Ich fange gerade an mich da ein wenig einzulesen: es lohnt sich, wenn man Fraktur mag.
Klaus