Register Guidelines E-Books Search Today's Posts Mark Forums Read

Go Back   MobileRead Forums > Non-English Discussions > Deutsches Forum > E-Books

Notices

Reply
 
Thread Tools Search this Thread
Old 07-12-2009, 03:30 PM   #31
ravenne
Wizard
ravenne ought to be getting tired of karma fortunes by now.ravenne ought to be getting tired of karma fortunes by now.ravenne ought to be getting tired of karma fortunes by now.ravenne ought to be getting tired of karma fortunes by now.ravenne ought to be getting tired of karma fortunes by now.ravenne ought to be getting tired of karma fortunes by now.ravenne ought to be getting tired of karma fortunes by now.ravenne ought to be getting tired of karma fortunes by now.ravenne ought to be getting tired of karma fortunes by now.ravenne ought to be getting tired of karma fortunes by now.ravenne ought to be getting tired of karma fortunes by now.
 
ravenne's Avatar
 
Posts: 4,917
Karma: 1840619
Join Date: Oct 2008
Location: Munich, Germany
Device: Kindle PW, PocketBook 360°, Cybook Gen3, iPad mini
Quote:
Originally Posted by Josch91 View Post
Ich habe mich jetzt mal wegen dem Finereader und der Frakturschrift schlau gemacht. Um Frakturschrift zu erkennen raucht man FineReader XIX (ca. 350€). Der normale Finereader besitzt jedoch einen Lernfunktion mit der man anscheinden auch recht gute Ergebnisse erzielen kann.
Oh wow! Und ich dachte, die Jugend von heute raucht nicht mehr?! Gibt's diese FineReaders auch in Light? Und Lernfunktion soll vermutlich Lungenfunktion heißen
[SIZE="-2"]
(sorry Josch, aber da konnte ich einfach nicht widerstehen!!!)[/SIZE]
ravenne is offline   Reply With Quote
Old 07-12-2009, 03:35 PM   #32
Hajo
Connoisseur
Hajo has a complete set of Star Wars action figures.Hajo has a complete set of Star Wars action figures.Hajo has a complete set of Star Wars action figures.Hajo has a complete set of Star Wars action figures.
 
Hajo's Avatar
 
Posts: 72
Karma: 376
Join Date: Mar 2009
Location: Verden, Germany
Device: Nokia N81 8GB, COOL-ER
Netseeker: Ich habe schon gesehen, dass du es inzwischen begriffen hast, aber ich korrigiere jetzt nichts mehr an meinem kleinen Erguss.

Nein. Du übersiehst dabei nichts. Es gibt wie überall im Leben auch hier kein absolutes falsch oder richtig. Ich habe halt nur eine Vorstellung davon, was ich gerne hätte, als Programmierer, als interessierter Nutzer solcher Seiten wie feedbooks oder manybooks, und als jemand, der aus Zeitdruck mit den Systemkatalogen der Baufachrichtlinien Vermessung ziemlich auf die Schnauze gefallen ist.

Ich möchte z. B. nicht, dass derjenige, der das OCR macht, die einzelnen Absätze mit P-Tags umklammert. Erstens hat er schon genug Arbeit, und zweitens will das vielleicht gar nicht jeder haben. Vielleicht will jemand ein PDF erstellen oder irgendein Format, dass heute noch keiner kennt.

Ich möchte blanke Informationen haben: Wo beginnt ein neuer Absatz? Vielleicht nach einer Leerzeile. Wo ist ein Szenenwechsel? Zum Beispiel nach einer Zeile, die nur ein Sternchen beinhaltet. Oder nach einer doppelten Leerzeile. Das ist Konvention, keine Wissenschaft.

Wenn ich jetzt als zusätzliche Information einbaue "Wo ist ein Zeilenende? Nach einem Umbruch", dann sagt das noch gar nichts über die Eignung für ein reflowable Endprodukt aus. Denn ein

<p>AAA BBB CCC DDD</p>

sähe ja nicht anders aus als ein

<p>AAA BBB
CCC DDD</p>

Ich weiß noch nicht, ob es etwas bringt, wenn man diese Zeilenumbrüche hat. Vielleicht macht es das nachträgliche Auffinden von Korrekturstellen leichter. Wenn die Absätze sehr lang ist, und jemand sagt "In der Zeile beginnend mit xxx", dann ist das hilfreich. Auf jeden Fall schadet es nicht.

Computer sind für stumpfsinnige Arbeiten ursprünglich mal erfunden worden. Solche kleinen Regeln wie "Ergänze vor jeder Textzeile nach einer Leerzeile ein '<p class="normal">', es sei denn, du bist gerade einem einsamen Sternchen begegnet, dann nimm stattdessen '<p class="first">'. Ist die nächste Zeile leer, hänge an diese ein '</p>' hinten an" sind einem Computer schnell beigebracht, da braucht sich kein Mensch mit abmühen.
Hajo is offline   Reply With Quote
Advert
Old 07-12-2009, 03:45 PM   #33
Josch91
Reader
Josch91 can teach chickens to fly.Josch91 can teach chickens to fly.Josch91 can teach chickens to fly.Josch91 can teach chickens to fly.Josch91 can teach chickens to fly.Josch91 can teach chickens to fly.Josch91 can teach chickens to fly.Josch91 can teach chickens to fly.Josch91 can teach chickens to fly.Josch91 can teach chickens to fly.Josch91 can teach chickens to fly.
 
Josch91's Avatar
 
Posts: 818
Karma: 3522
Join Date: Apr 2009
Location: Germany
Device: Kindle 4, iPad
Quote:
Originally Posted by netseeker View Post
350 Euronen?!

Vielen Dank, Josch. Ich glaube wir bleiben dann doch besser erstmal bei Tesseract. Es sei denn irgendjemand stiftet uns Finereader-Lizenzen. Wobei...warum fragen wir nicht einfach bei ABBYY an, ob sie uns unterstützen würden, sobald wir ein paar Hefte digitalisiert vorliegen haben? Fragen kostet ja erstmal noch nix.
Mann kann hier anscheinend auch eine Testversion ("Finreader Light") bestellen. Vielleicht sollte man wirklich mal bei Abbey eine kostenlose Lizenz anfragen. Wir könnten ja dann einen Abbey FineReader Schriftzug auf die www.rettet-den-luftpirat.de Seite packen.

Quote:
Originally Posted by ravenne
Oh wow! Und ich dachte, die Jugend von heute raucht nicht mehr?!
Die Jugend von heute raucht eben keinen Tabak mehr sondern Software.
Was glaubt Du wo Wörter wie Internetsucht, Computerspielsucht etc. herkommen.

Last edited by mtravellerh; 07-12-2009 at 04:06 PM.
Josch91 is offline   Reply With Quote
Old 07-12-2009, 04:05 PM   #34
netseeker
sleepless reader
netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.
 
netseeker's Avatar
 
Posts: 4,763
Karma: 615547
Join Date: Jan 2008
Location: Germany, near Stuttgart
Device: Sony PRS-505, PB 360° & 302, nook wi-fi, Kindle 3
Quote:
Originally Posted by Hajo View Post
Ich möchte z. B. nicht, dass derjenige, der das OCR macht, die einzelnen Absätze mit P-Tags umklammert. Erstens hat er schon genug Arbeit, und zweitens will das vielleicht gar nicht jeder haben. Vielleicht will jemand ein PDF erstellen oder irgendein Format, dass heute noch keiner kennt.
Wer das XHTML aus den OCR-Ergebnissen erstellt, hat doch nichts mit den Tags zu tun. Irgendjemand macht das OCR. Die Ausgabe ist Plain Text. Ein anderer oder aber sogar derjenige, der auch das OCR durchgeführt hat, formatiert den Plain Text in XHTML um. XHTML ist als Ausgangsbasis für PDF genausogut geeignet wie als Ausgangsbasis für ePub, Mobi oder irgend ein anderes Format. Es ist im Gegensatz zu allen Eigenerfindungen ein standardisiertes XML-Format, welches sich erfahrungsgemäß wunderbar für die Weiterverarbeitung eignet. (bspw. via XSLT wie bei Gutenberg DE)

Quote:
Originally Posted by Hajo View Post
Ich möchte blanke Informationen haben: Wo beginnt ein neuer Absatz? Vielleicht nach einer Leerzeile. Wo ist ein Szenenwechsel? Zum Beispiel nach einer Zeile, die nur ein Sternchen beinhaltet. Oder nach einer doppelten Leerzeile. Das ist Konvention, keine Wissenschaft.
Ich kann hier keinen Widerspruch erkennen. Ob Du einen Zeilenumbruch als ASCII 10 oder <br /> kodierst spielt doch für die Erkennung keine Rolle. Es spielt allerdings eine Rolle, ob das Ausgangsformat generell nochmal geparst werden muss oder ob man einfach ein Ausgabestyling drüber legen kann. Welchen Sinn hat es für uns den Ausgangstext exakt nach den 13.5 cm x 22,5 cm bzw. 15 x23 cm der Scanvorlagen zu kennzeichnen? Wie können wir sicher erkennen, ob ein Zeilenumbruch jetzt hart eingebaut war oder nur aufgrund der Formatbeschränkung vorgenommen wurde?

Quote:
Originally Posted by Hajo View Post
Ich weiß noch nicht, ob es etwas bringt, wenn man diese Zeilenumbrüche hat. Vielleicht macht es das nachträgliche Auffinden von Korrekturstellen leichter. Wenn die Absätze sehr lang ist, und jemand sagt "In der Zeile beginnend mit xxx", dann ist das hilfreich. Auf jeden Fall schadet es nicht.
Warum müssen wir Korrekturstellen später wieder auffinden? Das läuft mir jetzt doch ein wenig weit in ein generelles Korrektur- und Proofreadingprojekt. Sollten wir nicht einfach das machen, was für dieses Projekt praktikabel ist?

Quote:
Originally Posted by Hajo View Post
Computer sind für stumpfsinnige Arbeiten ursprünglich mal erfunden worden. Solche kleinen Regeln wie "Ergänze vor jeder Textzeile nach einer Leerzeile ein '<p class="normal">', es sei denn, du bist gerade einem einsamen Sternchen begegnet, dann nimm stattdessen '<p class="first">'. Ist die nächste Zeile leer, hänge an diese ein '</p>' hinten an" sind einem Computer schnell beigebracht, da braucht sich kein Mensch mit abmühen.
Leider funktioniert das nicht so einfach. Ich habe schon genug eBooks gemacht und bin lange genug Programmierer um zu wissen, dass derart einfache Regeln niemals ausreichen damit es im Endprodukt wirklich gut aussieht. Darüber hinaus bräuchte man bereits für die angeprochenen Regeln ein "Programm" bzw. eine Makrofolge, welche das Parsing vornimmt. Wozu das Ganze, wenn man mit XHTML ein leicht zu erstellendes und zu verwendendes Ausgangsformat erstellen könnte?
netseeker is offline   Reply With Quote
Old 07-12-2009, 04:19 PM   #35
Hajo
Connoisseur
Hajo has a complete set of Star Wars action figures.Hajo has a complete set of Star Wars action figures.Hajo has a complete set of Star Wars action figures.Hajo has a complete set of Star Wars action figures.
 
Hajo's Avatar
 
Posts: 72
Karma: 376
Join Date: Mar 2009
Location: Verden, Germany
Device: Nokia N81 8GB, COOL-ER
Netseeker, es geht sicherlich alles irgendwie, zweifellos auch nach deiner Methode. Ich merke auch, dass ich mich an einigen Stellen nicht sehr deutlich ausgedrückt habe, aber ich habe nicht die Nerven für derlei philosophische Diskussionen.
Hajo is offline   Reply With Quote
Advert
Old 07-12-2009, 04:48 PM   #36
netseeker
sleepless reader
netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.
 
netseeker's Avatar
 
Posts: 4,763
Karma: 615547
Join Date: Jan 2008
Location: Germany, near Stuttgart
Device: Sony PRS-505, PB 360° & 302, nook wi-fi, Kindle 3
Quote:
Originally Posted by Hajo View Post
Netseeker, es geht sicherlich alles irgendwie, zweifellos auch nach deiner Methode. Ich merke auch, dass ich mich an einigen Stellen nicht sehr deutlich ausgedrückt habe, aber ich habe nicht die Nerven für derlei philosophische Diskussionen.
Hajo, das lässt sich sehr leicht lösen: Mach einen konstruktiven, nachvollziehbaren Vorschlag. Nicht nur für das Format, sondern auch für die Verwendung und Weiterverarbeitung dieses Formats. Das hat nichts mit Philosophie zu tun sondern etwas mit Praktikabilität und ist ohnehin noch eines unserer kleinsten Probleme.

Last edited by netseeker; 07-12-2009 at 04:53 PM.
netseeker is offline   Reply With Quote
Old 07-12-2009, 04:52 PM   #37
netseeker
sleepless reader
netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.
 
netseeker's Avatar
 
Posts: 4,763
Karma: 615547
Join Date: Jan 2008
Location: Germany, near Stuttgart
Device: Sony PRS-505, PB 360° & 302, nook wi-fi, Kindle 3
Quote:
Originally Posted by Josch91 View Post
Mann kann hier anscheinend auch eine Testversion ("Finreader Light") bestellen. Vielleicht sollte man wirklich mal bei Abbey eine kostenlose Lizenz anfragen. Wir könnten ja dann einen Abbey FineReader Schriftzug auf die www.rettet-den-luftpirat.de Seite packen.
Ok, das nehme ich mal auf die ToDo-Liste. Bin mal gespannt wie die reagieren werden. Im Negativfall haben wir immer noch Tesseract als Ausweichmöglichkeit.

So, nachdem wir viel über Formate und OCR diskutiert haben, würde ich gern nochmal zum Hauptproblem zurückkommen: Habt ihr noch Ideen, welche Anlaufstellen für das Nachfragen nach Digitalisaten einer derart vergriffenen Serie in Frage kommen?
netseeker is offline   Reply With Quote
Old 07-12-2009, 04:53 PM   #38
Hajo
Connoisseur
Hajo has a complete set of Star Wars action figures.Hajo has a complete set of Star Wars action figures.Hajo has a complete set of Star Wars action figures.Hajo has a complete set of Star Wars action figures.
 
Hajo's Avatar
 
Posts: 72
Karma: 376
Join Date: Mar 2009
Location: Verden, Germany
Device: Nokia N81 8GB, COOL-ER
Meine vielleicht falsche Vorstellung ist, dass man einem OCR-Programm beibringen kann, wie es mit Zeilenenden und Absätzen bezüglichen Umbrüchen umzugehen hat, aber nicht unbedingt bezüglich von P-Tags, die darumgebaut werden sollen. Außerdem denke ich, dass ein Korrektor lieber mit dem reinen Text und Umbrüchen und Leerzeichen arbeitet als mit p-Tags mit Klassennamen.

Aber wenn du eine Vorstellung hast, wie es gemacht werden soll, brauchen wir nicht demokratischer sein als Wladimir Putin. Viel wichtiger als wie es gemacht wird, ist ohnehin, dass es einheitlich gemacht wird.
Hajo is offline   Reply With Quote
Old 07-12-2009, 04:57 PM   #39
netseeker
sleepless reader
netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.
 
netseeker's Avatar
 
Posts: 4,763
Karma: 615547
Join Date: Jan 2008
Location: Germany, near Stuttgart
Device: Sony PRS-505, PB 360° & 302, nook wi-fi, Kindle 3
Ok, sehen wir mal, ob es da noch weitere Meinungen gibt. Noch ist Zeit und wir brauchen die Entscheidung nicht zu überstürzen. Ich muss zugeben, dass ich dem OCR keine derart entscheidente Rolle zumesse. Da kommt Text raus und der muss korrigiert und in ein Grundformat gebracht werden. Bisher ging ich davon aus, dass wir das manuell machen und uns das OCR da bei der Grundformatierung nicht wirklich großartig hilft. Kann da jemand mit Finereader-Erfahrung etwas dazu sagen?
netseeker is offline   Reply With Quote
Old 07-12-2009, 05:07 PM   #40
Josch91
Reader
Josch91 can teach chickens to fly.Josch91 can teach chickens to fly.Josch91 can teach chickens to fly.Josch91 can teach chickens to fly.Josch91 can teach chickens to fly.Josch91 can teach chickens to fly.Josch91 can teach chickens to fly.Josch91 can teach chickens to fly.Josch91 can teach chickens to fly.Josch91 can teach chickens to fly.Josch91 can teach chickens to fly.
 
Josch91's Avatar
 
Posts: 818
Karma: 3522
Join Date: Apr 2009
Location: Germany
Device: Kindle 4, iPad
Ein erster Entwurf meines Banner ist fertig. Bitte spart nicht mit Kritik, Verbesserungen werden dann aber erst morgen gemcht.
Attached Thumbnails
Click image for larger version

Name:	Banner.jpg
Views:	389
Size:	109.0 KB
ID:	32076  
Josch91 is offline   Reply With Quote
Old 07-12-2009, 05:11 PM   #41
Hajo
Connoisseur
Hajo has a complete set of Star Wars action figures.Hajo has a complete set of Star Wars action figures.Hajo has a complete set of Star Wars action figures.Hajo has a complete set of Star Wars action figures.
 
Hajo's Avatar
 
Posts: 72
Karma: 376
Join Date: Mar 2009
Location: Verden, Germany
Device: Nokia N81 8GB, COOL-ER
Quote:
Originally Posted by netseeker View Post
Ich muss zugeben, dass ich dem OCR keine derart entscheidente Rolle zumesse.
Unterstellen wir mal, aus dem OCR kommt nur ein endlos langer Bandwurm. Dann würde ich trotzdem lieber jemanden bitten, vor jedem Absatz eine Leerzeile und vor jedem Szenenwechsel zwei Leerzeilen einzufügen, anstatt die Teile mit p-Tags der einen oder anderen Klasse zu kapseln (und bitte nicht das Schlusslicht vergessen). Für den Korrekturleser ist es sicherlich auch angenehmer, wenn nicht jeder Absatz mit den gleichen zehn, zwölf Zeichen beginnt, zumal wir hier nicht nach neuer deutscher Rechtschreibung korrigieren, ein Blick ins Original also durchaus gelegentlich mal sinnvoll sein kann.

Ich glaube, ich habe jetzt alles gesagt. Wenn ich noch immer schwer verständlich bin, mache ich mal ein Beispiel, sobald die ersten Scans vorliegen.
Hajo is offline   Reply With Quote
Old 07-12-2009, 05:43 PM   #42
netseeker
sleepless reader
netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.
 
netseeker's Avatar
 
Posts: 4,763
Karma: 615547
Join Date: Jan 2008
Location: Germany, near Stuttgart
Device: Sony PRS-505, PB 360° & 302, nook wi-fi, Kindle 3
Quote:
Originally Posted by Josch91 View Post
Ein erster Entwurf meines Banner ist fertig. Bitte spart nicht mit Kritik, Verbesserungen werden dann aber erst morgen gemcht.
Vielen Dank, Josch. Was mit gefällt ist, dass das Logo des Luftpiraten eingebaut ist und der Name der Aktion drin ist. Könnten wir da nicht anstelle der Hefte Targors Entwurf als Hintergund verwenden und den Schriftzug "Rettet" ein wenig an die Originalschrift anpassen?
netseeker is offline   Reply With Quote
Old 07-12-2009, 05:48 PM   #43
Josch91
Reader
Josch91 can teach chickens to fly.Josch91 can teach chickens to fly.Josch91 can teach chickens to fly.Josch91 can teach chickens to fly.Josch91 can teach chickens to fly.Josch91 can teach chickens to fly.Josch91 can teach chickens to fly.Josch91 can teach chickens to fly.Josch91 can teach chickens to fly.Josch91 can teach chickens to fly.Josch91 can teach chickens to fly.
 
Josch91's Avatar
 
Posts: 818
Karma: 3522
Join Date: Apr 2009
Location: Germany
Device: Kindle 4, iPad
Klar. Ich werde dann morgen noch etwas rumspielen. Ich kann Tagor ja auch mal, falls er Interesse hat, die psd-Datei schicken, dann kann er auch noch ein bisschen rumprobieren und muss die Schrift nicht erst freistellen.
Die Schriftart des Schriftzuges "Rettet" war eh nur eine schnelle Lösung. Ich finde auch das er noch nicht so wirklich passt. Ich wollte einfach nur mal schauen was das Rot aus den Orginalheften so als Schriftfarbe hergibt.

Last edited by Josch91; 07-12-2009 at 06:03 PM.
Josch91 is offline   Reply With Quote
Old 07-12-2009, 07:26 PM   #44
netseeker
sleepless reader
netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.
 
netseeker's Avatar
 
Posts: 4,763
Karma: 615547
Join Date: Jan 2008
Location: Germany, near Stuttgart
Device: Sony PRS-505, PB 360° & 302, nook wi-fi, Kindle 3
Anbei mal ein erster Entwurf für den Text des "offenen Briefs" im Netz. Noch nicht korrekturgelesen und hiermit zur öffentlichen Hinrichtung ähm konstruktiven Diskussion freigegeben.

Edit: Fassung 2 mit korrektem Akkusativ...
Attached Files
File Type: pdf Luftpirat.pdf (49.7 KB, 405 views)

Last edited by netseeker; 07-12-2009 at 08:07 PM.
netseeker is offline   Reply With Quote
Old 07-12-2009, 11:29 PM   #45
Eagleeye
Fanatic
Eagleeye rocks like Gibraltar!Eagleeye rocks like Gibraltar!Eagleeye rocks like Gibraltar!Eagleeye rocks like Gibraltar!Eagleeye rocks like Gibraltar!Eagleeye rocks like Gibraltar!Eagleeye rocks like Gibraltar!Eagleeye rocks like Gibraltar!Eagleeye rocks like Gibraltar!Eagleeye rocks like Gibraltar!Eagleeye rocks like Gibraltar!
 
Eagleeye's Avatar
 
Posts: 591
Karma: 100000
Join Date: Sep 2008
Location: Halle/S.
Device: BeBook, Pocketbook 360°; Kindle 3G
Quote:
Originally Posted by Hajo View Post
Ich möchte z. B. nicht, dass derjenige, der das OCR macht, die einzelnen Absätze mit P-Tags umklammert. Erstens hat er schon genug Arbeit, und zweitens will das vielleicht gar nicht jeder haben. Vielleicht will jemand ein PDF erstellen oder irgendein Format, dass heute noch keiner kennt.

Ich möchte blanke Informationen haben: Wo beginnt ein neuer Absatz? Vielleicht nach einer Leerzeile. Wo ist ein Szenenwechsel? Zum Beispiel nach einer Zeile, die nur ein Sternchen beinhaltet. Oder nach einer doppelten Leerzeile. Das ist Konvention, keine Wissenschaft.

Wenn ich jetzt als zusätzliche Information einbaue "Wo ist ein Zeilenende? Nach einem Umbruch", dann sagt das noch gar nichts über die Eignung für ein reflowable Endprodukt aus. Denn ein

<p>AAA BBB CCC DDD</p>

sähe ja nicht anders aus als ein

<p>AAA BBB
CCC DDD</p>

Ich weiß noch nicht, ob es etwas bringt, wenn man diese Zeilenumbrüche hat. Vielleicht macht es das nachträgliche Auffinden von Korrekturstellen leichter. Wenn die Absätze sehr lang ist, und jemand sagt "In der Zeile beginnend mit xxx", dann ist das hilfreich. Auf jeden Fall schadet es nicht.
Wenn ich mir das hier so durchlese - ist schon jemand auf die Idee gekommen, diese Arbeiten mit einem richtigen Textsatzprogramm (z.B. LaTeX) zu versuchen? Und bevor Ihr fragt: nein, mit LaTeX kenn ich mich leider gar nicht aus ; ich weiß nur , daß es das gibt.
Eagleeye is offline   Reply With Quote
Reply

Thread Tools Search this Thread
Search this Thread:

Advanced Search

Forum Jump

Similar Threads
Thread Thread Starter Forum Replies Last Post
Inhaltsverzeichnis unter Calibre?? - und andere Probleme bei der Ebook-Erstellung Momo_Germany Erste Hilfe 4 05-26-2009 04:38 PM
Philosophy Nietzsche, Friedrich: Der Wanderer und sein Schatten. v1 23 may 2009 german stahanovez Kindle Books 0 05-23-2009 01:38 PM
Philosophy Nietzsche, Friedrich: Der Wanderer und sein Schatten. v1.1 24 may 2009 german stahanovez ePub Books 0 05-23-2009 01:37 PM
Short Fiction Laßwitz, Kurd: Auf der Seifenblase und andere Erzählungen. german. v1. 04 mar 2009 netseeker ePub Books 0 03-04-2009 05:35 PM
Short Fiction Laßwitz, Kurd: Auf der Seifenblase und andere Erzählungen. german. v1. 04 mar 2009 netseeker Kindle Books 0 03-04-2009 05:34 PM


All times are GMT -4. The time now is 10:50 PM.


MobileRead.com is a privately owned, operated and funded community.