Quote:
Originally Posted by Hajo
Ich möchte z. B. nicht, dass derjenige, der das OCR macht, die einzelnen Absätze mit P-Tags umklammert. Erstens hat er schon genug Arbeit, und zweitens will das vielleicht gar nicht jeder haben. Vielleicht will jemand ein PDF erstellen oder irgendein Format, dass heute noch keiner kennt.
Ich möchte blanke Informationen haben: Wo beginnt ein neuer Absatz? Vielleicht nach einer Leerzeile. Wo ist ein Szenenwechsel? Zum Beispiel nach einer Zeile, die nur ein Sternchen beinhaltet. Oder nach einer doppelten Leerzeile. Das ist Konvention, keine Wissenschaft.
Wenn ich jetzt als zusätzliche Information einbaue "Wo ist ein Zeilenende? Nach einem Umbruch", dann sagt das noch gar nichts über die Eignung für ein reflowable Endprodukt aus. Denn ein
<p>AAA BBB CCC DDD</p>
sähe ja nicht anders aus als ein
<p>AAA BBB
CCC DDD</p>
Ich weiß noch nicht, ob es etwas bringt, wenn man diese Zeilenumbrüche hat. Vielleicht macht es das nachträgliche Auffinden von Korrekturstellen leichter. Wenn die Absätze sehr lang ist, und jemand sagt "In der Zeile beginnend mit xxx", dann ist das hilfreich. Auf jeden Fall schadet es nicht.
|
Wenn ich mir das hier so durchlese - ist schon jemand auf die Idee gekommen, diese Arbeiten mit einem richtigen Textsatzprogramm (z.B. LaTeX) zu versuchen? Und bevor Ihr fragt: nein, mit LaTeX kenn ich mich leider gar nicht aus

; ich weiß nur

, daß es das gibt.