Vorallem ließe sich das ganze ja wesentlich präzieser direkt nach dem ersten OCR-Schritt bearbeiten.
Je nach Einstellung sind dann nämlich die Seitenumbrüche noch vorhanden, damit wäre die Fehlerwarscheinlichkeit wesentlich reduziert - es sei denn der arme Vu-ye wird durch Zufall wirklich einmal nach dem "-" umgebrochen, was aber nicht sehr warscheinlich ist.
Ich finde übrigens auch, daß das Arbeit des Herstellers ist, nicht des Kunden - soweit kommt's noch!