06-17-2014, 01:29 PM | #856 |
Unicycle Daredevil
Posts: 13,923
Karma: 185041098
Join Date: Jan 2011
Location: Planet of the Pudding Brains
Device: Aura HD (R.I.P. After six years the USB socket died.) tolino shine 3
|
|
06-18-2014, 11:08 AM | #857 |
Guru
Posts: 606
Karma: 2058508
Join Date: Jun 2012
Location: Wien
Device: Sony Reader PRS-650 Kindle Voyage 3G
|
Herr Medard hat gewünscht, dass Fichte und Schelling in MR ein Debüt gegeben hätten.
Aber.. |
06-18-2014, 12:43 PM | #858 |
why in?
Posts: 1,620
Karma: 28802432
Join Date: Apr 2012
Device: Sony PRS-350, Kobo Aura
|
|
06-19-2014, 07:13 AM | #859 |
Guru
Posts: 606
Karma: 2058508
Join Date: Jun 2012
Location: Wien
Device: Sony Reader PRS-650 Kindle Voyage 3G
|
Ich habe nur gezeigt, dass nicht alle die materielle Torte mögen...
|
06-19-2014, 07:28 AM | #860 |
Unicycle Daredevil
Posts: 13,923
Karma: 185041098
Join Date: Jan 2011
Location: Planet of the Pudding Brains
Device: Aura HD (R.I.P. After six years the USB socket died.) tolino shine 3
|
Sondern was - den idealistischen Nadelbaum?
|
06-19-2014, 06:15 PM | #861 |
Guru
Posts: 606
Karma: 2058508
Join Date: Jun 2012
Location: Wien
Device: Sony Reader PRS-650 Kindle Voyage 3G
|
die idealistische alte österreichische Währung auch.
|
06-21-2014, 07:06 AM | #862 |
Groupie
Posts: 159
Karma: 629506
Join Date: Dec 2011
Device: Kobo Touch/Glo
|
Bitte um Fraktur-OCR
Ich bin jetzt zum zweiten Mal in Zeitungsartikeln über einen Aufsatz von Hans Delbrück gestolpert, den ich auch identifizieren und als Faksimile-PDF finden konnte.
Ich habe aber (noch) kein gescheites OCR-Programm, schon gar nicht für Fraktur. Wäre einer von den Könnern hier bereit, das Dokument durch die Mühle zu drehen? Hand anlegen für die allfälligen Korrekturen tue dann natürlich ich. |
06-21-2014, 08:34 AM | #863 | |
Grand Sorcerer
Posts: 5,584
Karma: 22735033
Join Date: Dec 2010
Device: Kindle PW2
|
Quote:
Nachtrag: Ich habe mir gerade die Bücher noch einmal angesehen und festgestellt, dass im Gegensatz zu den Preußischen Jahrbüchern nur wenige verwertbaren OCR-Text enthalten. Last edited by Doitsu; 06-21-2014 at 08:48 AM. |
|
06-21-2014, 04:46 PM | #864 | |
Berti
Posts: 1,196
Karma: 4985964
Join Date: Jan 2012
Location: Zischebattem
Device: Acer Lumiread
|
Einmal Wurstmaschine, bitteschön. Doll isses nich, aber die 28 Seiten sind ja wohl ein Klacks. (Der Darwin, den ich mal gemacht hab, hat schlimmer ausgesehen...)
Quote:
|
|
06-22-2014, 04:57 AM | #865 |
Groupie
Posts: 159
Karma: 629506
Join Date: Dec 2011
Device: Kobo Touch/Glo
|
Da bedanke ich mich ganz artig!
Wenn ich mir das so ansehe, werde ich zukünftig noch mehr zu schätzen wissen, wenn jemand ein Fraktur-Dokument sauber als Text erfasst hat. |
06-28-2014, 05:35 AM | #866 |
1►2pa®a¤d’♫ce
Posts: 2,628
Karma: 23374904
Join Date: Sep 2010
Device: <div class="div">
|
@ die Experten:
Bei der Produktion von "Heyse, Paul: Novellen III." bin ich mit zwei Problemen konfrontiert worden (grundsätzlich gilt, dass in <p> die "widows" und "orphans" auf Standard stehen, d.h. auf "2" geeicht sind): 1. Textblocktrennung mit <hr /> Wenn man nicht will, dass der Trennstrich allein auf der nächsten Seite steht, muss man hier "page-break-before: avoid" verordnen. Das aber führt dazu, dass z.T. an Stellen zuvor unschöne Lücken vor dem unteren Rand auftreten, damit vor dem Trennstrich noch 2 Zeilen bleiben. 2. Novellen- und Buchschlüsse Die einzelnen Bände innerhalb des eBooks enden etwa so: [...] so traurig bin!«</p> <p class="p35"><img alt="img7.png" height="35" src="../Images/img7.png" width="170" /></p> <p class="p0"><span class="t18">Druck von</span> <span class="t19">Gustav Schade</span><span class="t18">, Oranienburgerstr. 27.</span></p> Auf das Absatzende folgt eine Vignette und darauf eine Textzeile mit Angabe des Druckers. - Der Ästhetik zuliebe wäre das Zusammenhalten dieser drei Elemente wünschenswert. Deshalb brachte ich folgende Definition in den CSS ein: p + p.p35, p.p35 + p.p0, p + p.p9 { page-break-before: avoid; } Die negative Wirkung kann aber naturgemäß im unerfreulichsten Fall noch schlimmer aussehen als beim Problem 1. - Die Novellen wiederum enden mit einer Vignette. Das Problem gleicht Nr. 1: Das Zusammenhalten mit dem Absatzende (p + p.p9) kann zu unschönen Lücken davor führen. Setzt man nun die Wittwen und Waisen auf 1, kann es vorkommen, dass der Trennstrich, die Vignette oder die Druckerangabe bzw. Vignette plus Druckerangabe allein auf der nächsten Seite erscheinen. Ein Dilemma? Oder gibt es Lösungen? Sollte man besser das Zusammenhalten der betreffenden Paragraphen aufgeben und die Wittwen und Waisen auf 1 setzen, um einen geschlosseneren Satzspiegel zu erhalten? |
06-28-2014, 10:40 AM | #867 | |
Grand Sorcerer
Posts: 5,584
Karma: 22735033
Join Date: Dec 2010
Device: Kindle PW2
|
Quote:
Soweit ich weiß unterstützen die meisten ADE/RMSDK-basierten Leseprogramme ohnehin keine Silbentrennung. (D.h. Wörter mit weichen Trennstrichen werden zwar am Zeilenende umgebrochen; es wird aber kein Trennstrich angezeigt.) |
|
06-28-2014, 11:05 AM | #868 | |
1►2pa®a¤d’♫ce
Posts: 2,628
Karma: 23374904
Join Date: Sep 2010
Device: <div class="div">
|
Quote:
Hm. - Mein Post spricht (u.a.) ausdrücklich von <hr /> als Trennstrich zur Textblocktrennung: ....blablb aksjlik jpgojka pdo fkpg oma üdpk üad pflü pdlbüs. __________________ Sldiv jdfo bifmb lokd povkd pvö lmdvöb lfmxgö blmf dölbmy dövms...... ... und an keiner Stelle von Silbentrennung. Du könntest dir ja die bezeichneten Stellen (sollte das mit copy und paste ein Problem sein? <hr /> ist einfach <hr />, und das andere steht violett in meinem Post, jedenfalls sagt mein Display mir das [und im Tee hab' ich auch keinen]) mal auf deinem eReader anschauen, wenn es dir nicht zu viel ausmacht, die ePub-Datei auf denselben zu laden. |
|
06-28-2014, 11:59 AM | #869 | |
Grand Sorcerer
Posts: 5,584
Karma: 22735033
Join Date: Dec 2010
Device: Kindle PW2
|
Quote:
Soweit ich weiß werden mit <hr> definierte Linien normalerweise als Trennlinien oder Querlinien bezeichnet. Um auf Deine eigentliche Frage zurückzukommen, normalerweise wird empfohlen, derartige Textzeilen mit einem <div> einzuschließen, dem der Style page-break-inside: avoid; zugewiesen wurde. Nur ignorieren das die meisten Leseprogramme. Soweit ich weiß, kann man das nur durch Konvertierung von Text und Trennlinien in eine SVG-Grafik verhindern. Allerdings kann es dann passieren, dass diese Grafik am Anfang einer neuen Seite angezeigt wird. |
|
06-28-2014, 12:33 PM | #870 |
1►2pa®a¤d’♫ce
Posts: 2,628
Karma: 23374904
Join Date: Sep 2010
Device: <div class="div">
|
Danke, Doitsu.
Die "page-break-inside: avoid"-Geschichte für die Text-Zeilen vor dem <hr /> kann man tatsächlich vergessen, wenn <hr /> seinerseits die Anweisung "page-break-before: avoid" erhält! Das heißt, es gibt für mein <hr />-Problem eigentlich keine Lösung, die auf einem eReader ohne Garantieverfallsdatum realisiert werden kann!? Und Problem 2? Aber ich sehe gerade: du hast wohl nur Kindle-Geräte und kannst ePubs selbst so nicht in der Lesepraxis überprüfen ... Last edited by brucewelch; 06-28-2014 at 12:35 PM. |