Ich habe mich jetzt eine Weile damit beschäftigt.
Ich denke der Text ist public domain, was nicht frei verfügbar ist:
- sämtlicher Formatierungscode (html-tags, Inhaltsverzeichnis) - die Formatierung als solche (Absätze, Kapitel) hingegen hat der Autor geschaffen.
- code mit dem Bilder eingebunden werden, wohingegen die Bilder wiederum public domain sind, da unbearbeitet und folglich keine schöpferische Leistung vorhanden ist.
- Zuordnung zu Genres, Autorenlisten, Allgemeine Infos zu den Autoren
Da p-tags aber eben nur die technische Umsetzung der Formatierung sind, müßte man es nur löschen und neu setzen, wäre zwar softwaretechnischer Unfug, aber machbar. Optional wäre ein br-tag Die Fußnoten werden von dem Skript bereits komplett umformatiert.
Gleiches gilt für die Bilder, die sollen ohnhin noch etwas hübscher in den Text eingebunden werden. Ob man nun h1, h2 oder sonstwie die Kapiteltitel benennt ist sowieso egal, via css kann man es manipulieren, daß es so aussieht wie gewünscht.
Auf der anderen Seite sehe ich schon, daß da ne Menge Arbeit reingeflossen ist, finde es aber auch schade, daß man es nicht community-basiert aufgezogen hat, es wäre mittlerweile größer und bekannter und vermutlich auch besser. Ein script wie gbde.py wäre überflüssig.
Ich habe mich auch gefragt, ob man denen nichtmal erklären sollte was ein ebook ist.
Mal eine Frage an die Rechtsgelehrten

hier. Ich kaufe, scanne und ocr'e (ich brauche ein deutsches Verb dafür) eine aktuelle Ausgabe von zum Beispiel einem Reclam-Büchlein dessen Autor vor über 70 Jahren verstorben ist, hat nun ein Lektor oder Setzer oder der Verlag noch Rechte am Inhalt und Layout (jenseits des Schutzumschlages)? Kann ja sein, daß man einen Setzfehler mit ins ebook nimmt.