Register Guidelines E-Books Search Today's Posts Mark Forums Read

Go Back   MobileRead Forums > Non-English Discussions > Deutsches Forum > E-Books

Notices

Reply
 
Thread Tools Search this Thread
Old 03-17-2011, 02:19 PM   #1
brucewelch
"§µ%&Þ=?!©†"
brucewelch ought to be getting tired of karma fortunes by now.brucewelch ought to be getting tired of karma fortunes by now.brucewelch ought to be getting tired of karma fortunes by now.brucewelch ought to be getting tired of karma fortunes by now.brucewelch ought to be getting tired of karma fortunes by now.brucewelch ought to be getting tired of karma fortunes by now.brucewelch ought to be getting tired of karma fortunes by now.brucewelch ought to be getting tired of karma fortunes by now.brucewelch ought to be getting tired of karma fortunes by now.brucewelch ought to be getting tired of karma fortunes by now.brucewelch ought to be getting tired of karma fortunes by now.
 
brucewelch's Avatar
 
Posts: 1,088
Karma: 2248413
Join Date: Sep 2010
Device: pb 611
Gutenberg DEs neues Outfit

Seit einigen Tagen ist Gutenberg DE ja wieder online, allerdings mit beträchtlichen Veränderungen.
Frau Reuters schrieb mir:
Quote:
Wir (also ich) mußten in kurzer Zeit aus unserem Archivmaterial und den Resten des Online-Datenbestandes eine neue Version zusammenklöppeln, wobei einiges auf der Strecke blieb, u.A. alle meine Korrekturen an der Online-Version der letzten 4 Jahre. Gesperrte Texte mußten herausgefunden, Stylesheets umgearbeitet und fehlende Bilder zusammengesucht werden. Die Archivversion enthält neben vielen Besonderheiten u.A. Inhaltsverzeichnisse mit Links innerhalb der Datei, die im Datenbanksystem der Online-Version nicht funktionieren. Mit Hilfe der Leser können wir den alten Zustand langsam wiederherstellen, daher bin ich für jede Fehlermeldung dankbar.
Eine Druckversion wird es leider nicht mehr geben, auch keine Kapitelüberschriften mehr in der Navigation. Der Grund für Letzeres ist unsere uneinheitliche Textmarkierung im Archiv.
Dies heißt u.a., dass weder cextra noch gbde.py derzeit funktionieren; selbst das paste&copy-Pflücken bringt nur noch bei fußnotenlosen Texten etwas, weil die Fußnoten zwar einzeln aufpoppen, ihre Inhalte aber beim Copy-Vorgang nicht mitgenommen werden - stattdessen erscheint im Text: "[Fußnote]".
Bedauerlich!
brucewelch is offline   Reply With Quote
Old 03-17-2011, 04:30 PM   #2
Hokuspokus
Fidibus
Hokuspokus ought to be getting tired of karma fortunes by now.Hokuspokus ought to be getting tired of karma fortunes by now.Hokuspokus ought to be getting tired of karma fortunes by now.Hokuspokus ought to be getting tired of karma fortunes by now.Hokuspokus ought to be getting tired of karma fortunes by now.Hokuspokus ought to be getting tired of karma fortunes by now.Hokuspokus ought to be getting tired of karma fortunes by now.Hokuspokus ought to be getting tired of karma fortunes by now.Hokuspokus ought to be getting tired of karma fortunes by now.Hokuspokus ought to be getting tired of karma fortunes by now.Hokuspokus ought to be getting tired of karma fortunes by now.
 
Posts: 399
Karma: 1081365
Join Date: Feb 2010
Device: none
Sehr bedauerlich

Die Fußnoten sind aber weiterhin in der Webseite eingebettet. Hab eben mal ein bisschen rumgespielt. Webseite komplett gespeichert, .htm in .txt umbenannt und geöffnet. Mit "suche und ersetze" die entsprechenden tags gegen "[Fußnote: " und "]" ausgetauscht, Ergebnis:
Quote:
Wenn ich jetzt, ehe dieser »verbale Kongreß« [Fußnote: Ich wüßte wohl, wen man zum Präsidenten dieses Kongresses ernennen müßte: Fritz Mauthner!] getagt hat, die geistreichsten Leute miteinander diskutieren hörte, so lag mir jedesmal die Forderung auf den Lippen:
Lesbar!
Es erfordert ein bisschen Handarbeit, lässt sich aber bestimmt auch noch etwas automatisieren.
Hokuspokus is offline   Reply With Quote
Old 03-18-2011, 07:36 AM   #3
brucewelch
"§µ%&Þ=?!©†"
brucewelch ought to be getting tired of karma fortunes by now.brucewelch ought to be getting tired of karma fortunes by now.brucewelch ought to be getting tired of karma fortunes by now.brucewelch ought to be getting tired of karma fortunes by now.brucewelch ought to be getting tired of karma fortunes by now.brucewelch ought to be getting tired of karma fortunes by now.brucewelch ought to be getting tired of karma fortunes by now.brucewelch ought to be getting tired of karma fortunes by now.brucewelch ought to be getting tired of karma fortunes by now.brucewelch ought to be getting tired of karma fortunes by now.brucewelch ought to be getting tired of karma fortunes by now.
 
brucewelch's Avatar
 
Posts: 1,088
Karma: 2248413
Join Date: Sep 2010
Device: pb 611
Quote:
Die Fußnoten sind aber weiterhin in der Webseite eingebettet. Hab eben mal ein bisschen rumgespielt. Webseite komplett gespeichert, .htm in .txt umbenannt und geöffnet. Mit "suche und ersetze" die entsprechenden tags gegen "[Fußnote: " und "]" ausgetauscht ...
Sicher sind die Fußnoten noch da. Beim Umbenennen in eine TXT-Datei gehen doch aber alle Formatierungen verloren. Das kann nur für anspruchslos formatierte Prosatexte mit wenigen Anmerkungen eine Lösung sein.

Natürlich kann man die gesamte Website speichern, sie als htm z.B. in OpenOffice öffnen und hat dann alles, was die Seite enthält; aber man muss auch bei jeder Seite erst mal mühselig aufräumen. Bei Dahns "Völkerwanderung" wären das z.B. 85 Kapitel gewesen, die man so hätte behandeln müssen. Schon deshalb hätte ich da die Brocken hingeworfen.

Das folgende Zitat gibt den Text wieder, wie er nach der zuletzt bezeichneten Methode aussehen würde:

Quote:
... ein Volk, das sich selbst das germanische nannte, hat es niemals gegeben.(Daß dieser Name keltischen Ursprungs, das heißt, durch die Kelten zuerst in Gebrauch gekommen sei, ist unbezweifelt. ...
Die Fußnote beginnt hier mit der Klammer. Weder ein Fußnotenzeichen noch das Wort Fußnote taucht auf. 985 Fußnoten so zu behandeln ist ausgeschlossen.
brucewelch is offline   Reply With Quote
Old 03-18-2011, 08:05 AM   #4
Hokuspokus
Fidibus
Hokuspokus ought to be getting tired of karma fortunes by now.Hokuspokus ought to be getting tired of karma fortunes by now.Hokuspokus ought to be getting tired of karma fortunes by now.Hokuspokus ought to be getting tired of karma fortunes by now.Hokuspokus ought to be getting tired of karma fortunes by now.Hokuspokus ought to be getting tired of karma fortunes by now.Hokuspokus ought to be getting tired of karma fortunes by now.Hokuspokus ought to be getting tired of karma fortunes by now.Hokuspokus ought to be getting tired of karma fortunes by now.Hokuspokus ought to be getting tired of karma fortunes by now.Hokuspokus ought to be getting tired of karma fortunes by now.
 
Posts: 399
Karma: 1081365
Join Date: Feb 2010
Device: none
Äh, nee, die Formatierungen gehen nicht verloren.
Wenn man die Datei umbenennt, hat man den html Code. Darin kann man mit "suche und ersetze" die entsprechenden Tags, die für die aufpoppenden Fußnoten zuständig sind, gegen die eckigen Klammern und das Wort "Fußnote" austauschen. Dabei ist es völlig egal, ob ein Kapitel 1 oder 100 Fußnoten hat, denn man kann alle auf einen Streich ersetzen.
Man könnte sogar in einem ersten Schritt alle Kapitel in einer Datei zusammenfügen und dann alle Fußnoten auf einen Schlag bearbeiten. Auch wenn es 985 sind. Die Mühle rechnet dann halt ein kleines bisschen länger.

Die ganze Werbung am Anfang und am Ende eines Kapitels zu entfernen, wäre allerdings bei 85 Kapiteln extrem viel Arbeit. 20-30 wären aber schon machbar. Man muss es ja nicht an einem Tag erledigen.

Wenn man die Werbung dann entfernt und die Fußnoten umformatiert hat, benennt man die Datei wieder nach .htm um und im Browser öffnet sich ein wunderbar sauberer Text mit eingearbeiteten Fußnoten. Alle anderen Formatierungen, wie fett, kursiv, Überschriften usw. sind noch vorhanden.
Das kann man dann mit copy and past nach OpenOffice oder LibreOffice übertragen und auch hier bleiben fett, kursiv, Überschriften usw. erhalten. Mit der Erweiterung Writer2epub kann man daraus ein ePub erzeugen, dass die Formatierungen ebenso übernimmt und ein neues ePub-geeignetes html erzeugt. Nur zentriert oder linksbündig müsste man dann noch von Hand mit Sigil überarbeiten.
Hokuspokus is offline   Reply With Quote
Old 03-18-2011, 11:18 AM   #5
brucewelch
"§µ%&Þ=?!©†"
brucewelch ought to be getting tired of karma fortunes by now.brucewelch ought to be getting tired of karma fortunes by now.brucewelch ought to be getting tired of karma fortunes by now.brucewelch ought to be getting tired of karma fortunes by now.brucewelch ought to be getting tired of karma fortunes by now.brucewelch ought to be getting tired of karma fortunes by now.brucewelch ought to be getting tired of karma fortunes by now.brucewelch ought to be getting tired of karma fortunes by now.brucewelch ought to be getting tired of karma fortunes by now.brucewelch ought to be getting tired of karma fortunes by now.brucewelch ought to be getting tired of karma fortunes by now.
 
brucewelch's Avatar
 
Posts: 1,088
Karma: 2248413
Join Date: Sep 2010
Device: pb 611
Quote:
... nee, die Formatierungen gehen nicht verloren.
Wenn man die Datei umbenennt, hat man den html Code.
[Das "Äh" hab ich im Zitat mal weggelassen ...]

Du hast natürlich recht, war ein mentaler Kurzschluss. (Man sollte eben immer erst laden, dann schießen.)
Das ist ein beschreitbarer Weg, auf den ich noch gar nicht gekommen war. Die Fußnoten zu tatsächlichen Fußnoten zu machen, steht zwar dann immer noch aus; aber bis dahin hätte man schon einen formatierten Rohbau.
Wenn eben nur das nervige Entmüllen der jeweiligen Seite nicht wäre! Dieses erfordert in der Text-Ansicht einer htm-Datei entschieden mehr Aufmerksamkeit, als wenn man die htm-Ansicht z.B. in OO nutzen kann.
Danke für den Tipp!
brucewelch is offline   Reply With Quote
Old 03-20-2011, 07:47 AM   #6
troll05
Harmless idiot
troll05 ought to be getting tired of karma fortunes by now.troll05 ought to be getting tired of karma fortunes by now.troll05 ought to be getting tired of karma fortunes by now.troll05 ought to be getting tired of karma fortunes by now.troll05 ought to be getting tired of karma fortunes by now.troll05 ought to be getting tired of karma fortunes by now.troll05 ought to be getting tired of karma fortunes by now.troll05 ought to be getting tired of karma fortunes by now.troll05 ought to be getting tired of karma fortunes by now.troll05 ought to be getting tired of karma fortunes by now.troll05 ought to be getting tired of karma fortunes by now.
 
troll05's Avatar
 
Posts: 3,281
Karma: 2065059
Join Date: Nov 2010
Location: Zuhause
Device: PB622, Nexus7, Sony PRS 350, Tolino und nur noch wenig toter Baum:(
Quote:
Originally Posted by brucewelch View Post
Wenn eben nur das nervige Entmüllen der jeweiligen Seite nicht wäre! Dieses erfordert in der Text-Ansicht einer htm-Datei entschieden mehr Aufmerksamkeit, als wenn man die htm-Ansicht z.B. in OO nutzen kann.
Danke für den Tipp!
Hast du mal versucht das entmüllen des Textes nach der epub Konvertierung mit Sigil zu machen? Mit der HTML Suche-Ersetze Funktion brauchst du normalerweise 3-4 Ansätze, dann ist alles raus. Mach ich viel mit konvertierten PDFs, wenn Kopf-oder Fusszeilen mit eingearbeitet wurden.
troll05 is offline   Reply With Quote
Old 03-31-2011, 11:25 AM   #7
brucewelch
"§µ%&Þ=?!©†"
brucewelch ought to be getting tired of karma fortunes by now.brucewelch ought to be getting tired of karma fortunes by now.brucewelch ought to be getting tired of karma fortunes by now.brucewelch ought to be getting tired of karma fortunes by now.brucewelch ought to be getting tired of karma fortunes by now.brucewelch ought to be getting tired of karma fortunes by now.brucewelch ought to be getting tired of karma fortunes by now.brucewelch ought to be getting tired of karma fortunes by now.brucewelch ought to be getting tired of karma fortunes by now.brucewelch ought to be getting tired of karma fortunes by now.brucewelch ought to be getting tired of karma fortunes by now.
 
brucewelch's Avatar
 
Posts: 1,088
Karma: 2248413
Join Date: Sep 2010
Device: pb 611
Quote:
Hast du mal versucht das entmüllen des Textes nach der epub Konvertierung mit Sigil zu machen?
Danke, merk ich mir. Im Augenblick halte ich mich bei solchen Unternehmungen erst mal zurück.

brucewelch is offline   Reply With Quote
Old 04-16-2011, 08:04 AM   #8
Alaska
Leser
Alaska knows more than wikipediaAlaska knows more than wikipediaAlaska knows more than wikipediaAlaska knows more than wikipediaAlaska knows more than wikipediaAlaska knows more than wikipediaAlaska knows more than wikipediaAlaska knows more than wikipediaAlaska knows more than wikipediaAlaska knows more than wikipediaAlaska knows more than wikipedia
 
Alaska's Avatar
 
Posts: 852
Karma: 47176
Join Date: Nov 2009
Location: Berlin, Germany
Device: Kindle PW, iPad 3
Ich habe jetzt mal zwei Karl-May-Bücher nach den Fußnoten angesehen (weil ich die mit den Kindleversionen verglichen habe), die poppen inzwischen nicht mal mehr auf, die sind einfach weg. Das Wort im Text hat einen grauen Hintergrund.

"Durch die Wüste" und "Am Jenseits".
Alaska is offline   Reply With Quote
Old 07-09-2011, 03:56 PM   #9
Benjamin Buford
Connoisseur
Benjamin Buford once ate a cherry pie in a record 7 seconds.Benjamin Buford once ate a cherry pie in a record 7 seconds.Benjamin Buford once ate a cherry pie in a record 7 seconds.Benjamin Buford once ate a cherry pie in a record 7 seconds.Benjamin Buford once ate a cherry pie in a record 7 seconds.Benjamin Buford once ate a cherry pie in a record 7 seconds.Benjamin Buford once ate a cherry pie in a record 7 seconds.Benjamin Buford once ate a cherry pie in a record 7 seconds.Benjamin Buford once ate a cherry pie in a record 7 seconds.Benjamin Buford once ate a cherry pie in a record 7 seconds.Benjamin Buford once ate a cherry pie in a record 7 seconds.
 
Posts: 94
Karma: 1841
Join Date: Jun 2011
Device: N/A
Ich frage mich: Wieso zum Teufel gibt es bei Spiegel/Gutenberg-DE keine EPUBs?

Und arg fehlerbehaftet scheint die Chose auch noch zu sein: In diesem Buch fehlt ein ganzes Kapitel (das letzte: Kapitel 12 im zweiten Band). Bei Zeno.org fehlt das Kapitel nicht.
Benjamin Buford is offline   Reply With Quote
Old 07-15-2011, 05:36 AM   #10
brucewelch
"§µ%&Þ=?!©†"
brucewelch ought to be getting tired of karma fortunes by now.brucewelch ought to be getting tired of karma fortunes by now.brucewelch ought to be getting tired of karma fortunes by now.brucewelch ought to be getting tired of karma fortunes by now.brucewelch ought to be getting tired of karma fortunes by now.brucewelch ought to be getting tired of karma fortunes by now.brucewelch ought to be getting tired of karma fortunes by now.brucewelch ought to be getting tired of karma fortunes by now.brucewelch ought to be getting tired of karma fortunes by now.brucewelch ought to be getting tired of karma fortunes by now.brucewelch ought to be getting tired of karma fortunes by now.
 
brucewelch's Avatar
 
Posts: 1,088
Karma: 2248413
Join Date: Sep 2010
Device: pb 611
Quote:
Originally Posted by Benjamin Buford View Post
Ich frage mich: Wieso zum Teufel gibt es bei Spiegel/Gutenberg-DE keine EPUBs?
Das liegt an der kommerziellen Ausrichtung von Gutenberg-DE; die leben von diesem Job, im Gegensatz zu Project Gutenberg in den USA.
Aber der gesamte Gutenberg-DE-Bestand wandert ja früher oder später zum Kindle-Shop, wo er für lau und als komplettes ebook zu erhalten ist, das allerdings vom Kindle-Format noch zu epub konvertiert werden muss.
brucewelch is offline   Reply With Quote
Reply

Thread Tools Search this Thread
Search this Thread:

Advanced Search

Forum Jump

Similar Threads
Thread Thread Starter Forum Replies Last Post
Des bibliothèques qui prêtent des livres numériques ? glin Lounge français 16 01-18-2011 08:36 AM
Frohes neues 2011 Marc_liest Lounge 12 01-02-2011 04:02 PM
Neues Unterforum gustav011 PocketBook 12 11-30-2009 07:16 AM
gutenberg.com is not gutenberg.org ProDigit News 2 11-21-2008 12:39 PM
Western Grey, Zane: The Hash Knife Outfit. v1. 28 May 07 Dr. Drib BBeB/LRF Books 0 05-28-2007 05:18 PM


All times are GMT -4. The time now is 06:13 PM.


MobileRead.com is a privately owned, operated and funded community.