Register Guidelines E-Books Search Today's Posts Mark Forums Read

Go Back   MobileRead Forums > Non-English Discussions > Deutsches Forum > E-Books

Notices

Reply
 
Thread Tools Search this Thread
Old 11-18-2009, 02:16 PM   #181
polyfragmentiert
Groupie
polyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshes
 
polyfragmentiert's Avatar
 
Posts: 181
Karma: 14258
Join Date: Oct 2009
Location: Kiel, Germany
Device: SONY PRS-T1, bald tolino vision 3 HD
Hallo ravenne,

Quote:
Originally Posted by ravenne View Post
(...) nein passiert ist meines Wissens nichts zwischenzeitlich. Wir könnten versuchen, das Thema im neuen Jahr zu 'reanimieren'. Ist ja schön, dass nach wie vor Interesse besteht.
Genau deswegen auch von mir der Einwurf. Möglicherweise inspiriert das die bisherigen Macher und schürt den Enthusiasmus wieder. Ich weiß von mir selbst, dass mir viele Dinge mehr Spaß machen, wenn es zusammen mit anderen passiert und dabei so ein "Projektfieber" entfacht wird.

Ich finde das Projekt unterstützenswert und las mit Freude, wie Leute Websites und Banner entwarfen, Recherchen betrieben, ...
polyfragmentiert is offline   Reply With Quote
Old 11-18-2009, 02:40 PM   #182
mtravellerh
book creator
mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.
 
mtravellerh's Avatar
 
Posts: 9,635
Karma: 3856660
Join Date: Oct 2008
Location: Luxembourg
Device: PB360°
Ich wäre bereit, das Projekt kommissarisch weiter zu führen, bis netseeker sich wieder meldet! Wir könnten aber erst 2010 loslegen, da ich derzeit an Robert Kraft und Karl May arbeite und das ziemlich zeitraubend ist!
mtravellerh is offline   Reply With Quote
Old 11-18-2009, 02:42 PM   #183
polyfragmentiert
Groupie
polyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshespolyfragmentiert can read faster than his screen refreshes
 
polyfragmentiert's Avatar
 
Posts: 181
Karma: 14258
Join Date: Oct 2009
Location: Kiel, Germany
Device: SONY PRS-T1, bald tolino vision 3 HD
Das liest sich doch schonmal gut! Danke, mtravellerh.
polyfragmentiert is offline   Reply With Quote
Old 11-20-2009, 06:10 AM   #184
mtravellerh
book creator
mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.
 
mtravellerh's Avatar
 
Posts: 9,635
Karma: 3856660
Join Date: Oct 2008
Location: Luxembourg
Device: PB360°
Ich schlag schon mal vor, dass wir uns mal umshen sollten, was es online so gibt (also die verfügbaren Texte). Wir könnten ja hier reinschreiben, was wir so gefunden haben. Auch Ideen für die Beschaffung von weiterem Material wären willkommen!

Ich weiß, dass es bei ablit.de massenweise digitale Frakturtexte bereit liegen, an denen man schon mal austesten kann, ob und wie die vorhandene OCR-Software läuft. Marc-liest hat schon sehr gute Resultate mit einem Luftpiratheft gehabt. Vielleicht könnte er uns ja sagen, wie er genau vorgegangen ist. Bei mir lassen die Resultate bis dato noch arg zu wünschen übrig, ich bin allerdings auch, was Fraktur-OCR angeht, absolut ein blutiger Laie!

Wenn wir an der vorgeschlagenen Romanheftreihe festhalten, wäre ich für Vorschläge zur Materialbeschaffung dankbar! Gibt es eine Datenbank mit den Sammlern und ihren Archiven? Das wäre sehr gut zu wissen!
mtravellerh is offline   Reply With Quote
Old 11-20-2009, 01:58 PM   #185
Josch91
Reader
Josch91 can teach chickens to fly.Josch91 can teach chickens to fly.Josch91 can teach chickens to fly.Josch91 can teach chickens to fly.Josch91 can teach chickens to fly.Josch91 can teach chickens to fly.Josch91 can teach chickens to fly.Josch91 can teach chickens to fly.Josch91 can teach chickens to fly.Josch91 can teach chickens to fly.Josch91 can teach chickens to fly.
 
Josch91's Avatar
 
Posts: 818
Karma: 3522
Join Date: Apr 2009
Location: Germany
Device: Kindle 4, iPad
Falls hier jemand mit dem Abbeyy Fine Reader 9 Arbeitet, habe ich hier eine recht ausführliche Anleitung gefunden wie Frakturschrift gescannt werden kann. Viellecht hilft es jemandem weiter.
Ich bin im Schulstress (Abi) und kann leider momentan nicht so viel beitragen.
Josch91 is offline   Reply With Quote
Old 11-26-2009, 01:30 PM   #186
eibix
Groupie
eibix began at the beginning.
 
eibix's Avatar
 
Posts: 168
Karma: 34
Join Date: Nov 2009
Location: Wendelstein b. Nürnberg
Device: Kindle Touch, PocketBook 360
Ich habe mich jetzt auch durch den kompletten Thread gelesen und war begeistert wie ihr hier angefangen habt. Warum ist es denn so plötzlich abgebrochen? Wenn ich irgendwas beitragen kann, würde ich das auch gern tun. Allerdings weiß ich noch nicht so genau was. Wenn Aufgaben verteilt werden und etwas für mich dabei ist, schreie ich 'HIER'!

Wie ist denn jetzt der Stand?
eibix is offline   Reply With Quote
Old 11-26-2009, 01:42 PM   #187
Marc_liest
Early Adopter
Marc_liest ought to be getting tired of karma fortunes by now.Marc_liest ought to be getting tired of karma fortunes by now.Marc_liest ought to be getting tired of karma fortunes by now.Marc_liest ought to be getting tired of karma fortunes by now.Marc_liest ought to be getting tired of karma fortunes by now.Marc_liest ought to be getting tired of karma fortunes by now.Marc_liest ought to be getting tired of karma fortunes by now.Marc_liest ought to be getting tired of karma fortunes by now.Marc_liest ought to be getting tired of karma fortunes by now.Marc_liest ought to be getting tired of karma fortunes by now.Marc_liest ought to be getting tired of karma fortunes by now.
 
Marc_liest's Avatar
 
Posts: 3,161
Karma: 3534948
Join Date: Oct 2008
Location: hier und da
Device: einige
Ruhend.

Ich werde dieses WE das eine oder andere OCR Programm auf meinem neuen iMac installieren und die ersten Versuche machen.
Marc_liest is offline   Reply With Quote
Old 11-27-2009, 02:40 AM   #188
ravenne
Wizard
ravenne ought to be getting tired of karma fortunes by now.ravenne ought to be getting tired of karma fortunes by now.ravenne ought to be getting tired of karma fortunes by now.ravenne ought to be getting tired of karma fortunes by now.ravenne ought to be getting tired of karma fortunes by now.ravenne ought to be getting tired of karma fortunes by now.ravenne ought to be getting tired of karma fortunes by now.ravenne ought to be getting tired of karma fortunes by now.ravenne ought to be getting tired of karma fortunes by now.ravenne ought to be getting tired of karma fortunes by now.ravenne ought to be getting tired of karma fortunes by now.
 
ravenne's Avatar
 
Posts: 4,917
Karma: 1840619
Join Date: Oct 2008
Location: Munich, Germany
Device: Kindle PW, PocketBook 360°, Cybook Gen3, iPad mini
Quote:
Originally Posted by Marc_liest View Post
Ruhend.

Ich werde dieses WE das eine oder andere OCR Programm auf meinem neuen iMac installieren und die ersten Versuche machen.
Sehr cool, dass es hier weitergeht.
ravenne is offline   Reply With Quote
Old 11-29-2009, 06:38 AM   #189
Marc_liest
Early Adopter
Marc_liest ought to be getting tired of karma fortunes by now.Marc_liest ought to be getting tired of karma fortunes by now.Marc_liest ought to be getting tired of karma fortunes by now.Marc_liest ought to be getting tired of karma fortunes by now.Marc_liest ought to be getting tired of karma fortunes by now.Marc_liest ought to be getting tired of karma fortunes by now.Marc_liest ought to be getting tired of karma fortunes by now.Marc_liest ought to be getting tired of karma fortunes by now.Marc_liest ought to be getting tired of karma fortunes by now.Marc_liest ought to be getting tired of karma fortunes by now.Marc_liest ought to be getting tired of karma fortunes by now.
 
Marc_liest's Avatar
 
Posts: 3,161
Karma: 3534948
Join Date: Oct 2008
Location: hier und da
Device: einige
Ich habe nun 5 Stunden in das Programm Readiris Pro 11.6 investiert.
Alles was da bisher raus kommt ist grausam! Da ist Abtippen besser geeignet.
(Bezieht sich nur auf Frakturtexte)

Als nächstes werde ich nun den Abbeyy Fine Reader testen.
Marc_liest is offline   Reply With Quote
Old 11-29-2009, 10:59 AM   #190
ravenne
Wizard
ravenne ought to be getting tired of karma fortunes by now.ravenne ought to be getting tired of karma fortunes by now.ravenne ought to be getting tired of karma fortunes by now.ravenne ought to be getting tired of karma fortunes by now.ravenne ought to be getting tired of karma fortunes by now.ravenne ought to be getting tired of karma fortunes by now.ravenne ought to be getting tired of karma fortunes by now.ravenne ought to be getting tired of karma fortunes by now.ravenne ought to be getting tired of karma fortunes by now.ravenne ought to be getting tired of karma fortunes by now.ravenne ought to be getting tired of karma fortunes by now.
 
ravenne's Avatar
 
Posts: 4,917
Karma: 1840619
Join Date: Oct 2008
Location: Munich, Germany
Device: Kindle PW, PocketBook 360°, Cybook Gen3, iPad mini
Quote:
Originally Posted by Marc_liest View Post
Ich habe nun 5 Stunden in das Programm Readiris Pro 11.6 investiert.
Alles was da bisher raus kommt ist grausam! Da ist Abtippen besser geeignet.
(Bezieht sich nur auf Frakturtexte)

Als nächstes werde ich nun den Abbeyy Fine Reader testen.
Oje, tut mir leid, dass Du da umsonst so viel Zeit investiert hast. Hoffentlich läuft der nächste Versuch besser!
ravenne is offline   Reply With Quote
Old 12-04-2009, 11:42 AM   #191
netseeker
sleepless reader
netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.
 
netseeker's Avatar
 
Posts: 4,763
Karma: 615547
Join Date: Jan 2008
Location: Germany, near Stuttgart
Device: Sony PRS-505, PB 360° & 302, nook wi-fi, Kindle 3
Hallo Leute, schön zu sehen, dass hier das Feuer - wenn auch nicht zuletzt durch meine lange Abwesenheit ziemlich auf Sparflamme - noch brennt.

2009 neigt sich dem Ende entgegen und ich glaube nicht, dass wir neben den Vorbereitungen wie die Auswahl eines OCR-Systems sowie der Wiederaufnahme der "Verhandlungen" um schwer bekömmliche Quellen dieses Jahr noch viel erreichen können.

Bezüglich OCR:
Ich muss ganz ehrlich sagen, dass ich am liebsten auf ein freies OCR setzen würde, selbst wenn die Qualität dann evtl. nicht mit den teils hochpreisigen kommerziellen Programmen mithalten könnte. Das käme dem freien Charakter dieses Projekts imho am nächsten. Auf der anderen Seite könnten wir natürlich auch versuchen bei Abby & Co auf die Tränendrüse zu drücken um eine Lizenz für dieses Projekt gesponsert zu bekommen. Naja, erstmal abwarten, was für Ergebnisse Marc noch präsentieren kann oder ob ihn die Geduld mit den "tollen" OCR-Produkten irgendwann verlässt.

Demnächst wird es allerdings ohnehin im MobileRead Dev Hub ein Projekt für Tesseract geben. Ich hatte unabhängig von diesem Projekt hier vor einen "GUI-Wrapper" um Tesseract zu bauen, welcher
  • PDF's oder fertig eingescannte Bilder (in anderen Formaten als unkomprimiertes Graustufen-TIF) an Tesseract verfüttern kann
  • automatisch die passendste Bounding-Box sowie die passendste Auflösung der Bildaten für Tesseract berechnet
  • die grafische Auswahl der zu verwendenden Trainingsdaten (deutsch, deutsch fraktur, englisch usw.) pro OCR-Lauf ermöglicht
  • die Ergebnis-Ausgaben automatisch in eine Datei zusammenführt
  • optional typische OCR-Fehler korrigiert
  • optional eine Korrektur via Spellchecker durchführt
  • und schlußendlich aus dem Ergebnis eine Vorlage zum Korrekturlesen und Weiterverarbeiten erzeugt

Ob wir dann tatsächlich Tesseract hier in die engere Auswahl holen wollen, sei allerdings mal dahingestellt. Das Tesseract-Projekt sollte ursprünglich haupttsächlich dazu dienen den Uploadern bisher schwer verarbeitbare Quellen auf Basis freier Software zu erschließen...
netseeker is offline   Reply With Quote
Old 12-04-2009, 11:45 AM   #192
mtravellerh
book creator
mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.
 
mtravellerh's Avatar
 
Posts: 9,635
Karma: 3856660
Join Date: Oct 2008
Location: Luxembourg
Device: PB360°
Ich schlag mal als Material die Digitalscans der Ablit vor. Auch die Karl-May-Gesellschaft hat fraktales massenweise. Bis zur Erschöpfung Material zum Ueben gibt es bei Wikisource D.

Quote:
Originally Posted by netseeker View Post

Bezüglich OCR:
Ich muss ganz ehrlich sagen, dass ich am liebsten auf ein freies OCR setzen würde, selbst wenn die Qualität dann evtl. nicht mit den teils hochpreisigen kommerziellen Programmen mithalten könnte. Das käme dem freien Charakter dieses Projekts imho am nächsten. Auf der anderen Seite könnten wir natürlich auch versuchen bei Abby & Co auf die Tränendrüse zu drücken um eine Lizenz für dieses Projekt gesponsert zu bekommen. Naja, erstmal abwarten, was für Ergebnisse Marc noch präsentieren kann oder ob ihn die Geduld mit den "tollen" OCR-Produkten irgendwann verlässt.

Demnächst wird es allerdings ohnehin im MobileRead Dev Hub ein Projekt für Tesseract geben. Ich hatte unabhängig von diesem Projekt hier vor einen "GUI-Wrapper" um Tesseract zu bauen, welcher
  • PDF's oder fertig eingescannte Bilder (in anderen Formaten als unkomprimiertes Graustufen-TIF) an Tesseract verfüttern kann
  • automatisch die passendste Bounding-Box sowie die passendste Auflösung der Bildaten für Tesseract berechnet
  • die grafische Auswahl der zu verwendenden Trainingsdaten (deutsch, deutsch fraktur, englisch usw.) pro OCR-Lauf ermöglicht
  • die Ergebnis-Ausgaben automatisch in eine Datei zusammenführt
  • optional typische OCR-Fehler korrigiert
  • optional eine Korrektur via Spellchecker durchführt
  • und schlußendlich aus dem Ergebnis eine Vorlage zum Korrekturlesen und Weiterverarbeiten erzeugt

Ob wir dann tatsächlich Tesseract hier in die engere Auswahl holen wollen, sei allerdings mal dahingestellt. Das Tesseract-Projekt sollte ursprünglich haupttsächlich dazu dienen den Uploadern bisher schwer verarbeitbare Quellen auf Basis freier Software zu erschließen...
Nimmst Du eine universelle Sprache für das GUI (beispielsweise Java oder Python), damit wir anderen Pinguine auch teilhaben können?

Last edited by mtravellerh; 12-04-2009 at 11:48 AM.
mtravellerh is offline   Reply With Quote
Old 12-04-2009, 12:01 PM   #193
netseeker
sleepless reader
netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.
 
netseeker's Avatar
 
Posts: 4,763
Karma: 615547
Join Date: Jan 2008
Location: Germany, near Stuttgart
Device: Sony PRS-505, PB 360° & 302, nook wi-fi, Kindle 3
Quote:
Originally Posted by mtravellerh View Post
Ich schlag mal als Material die Digitalscans der Ablit vor. Auch die Karl-May-Gesellschaft hat fraktales massenweise. Bis zur Erschöpfung Material zum Ueben gibt es bei Wikisourse D.
Wären zum Üben nicht die digitalen Reprints des "Detektiv Nobody" der May-Gesellschaft gut geeignet? Dann hätten wir gleich den Vergleich mit Deinen manuell nachkorrigierten Fassungen. Auf der anderen Seite sind die PDF's natürlich bereits wieder qualitativ schlechter als Originalscans. Gibts bei Ablit eigentlich richtige Scan-Original-Bilder?
netseeker is offline   Reply With Quote
Old 12-04-2009, 01:09 PM   #194
Josch91
Reader
Josch91 can teach chickens to fly.Josch91 can teach chickens to fly.Josch91 can teach chickens to fly.Josch91 can teach chickens to fly.Josch91 can teach chickens to fly.Josch91 can teach chickens to fly.Josch91 can teach chickens to fly.Josch91 can teach chickens to fly.Josch91 can teach chickens to fly.Josch91 can teach chickens to fly.Josch91 can teach chickens to fly.
 
Josch91's Avatar
 
Posts: 818
Karma: 3522
Join Date: Apr 2009
Location: Germany
Device: Kindle 4, iPad
Ich habe jetzt einmal mit der Anleitung für den Abbeyy Fine Reader, die ich oben gepostet habe, die ersten 50 Seiten des ersten Nobody eingelesen. Da ich nur die ersten drei Seiten für die Mustererstellung verwendet habe, fehlen noch einige wenige Zeichen.
Hier das Ergebnis. Ich habe keine Veränderungen mit Search & Replace etc. unternommen, die Datei kommt frisch aus dem Fine Reader. Viele Probleme mit "u und n, o und v, u und natürlich f und s". Schneller als abtippen dürfte es aber trotzdem sein.

Last edited by Josch91; 12-04-2009 at 01:23 PM.
Josch91 is offline   Reply With Quote
Old 12-04-2009, 02:19 PM   #195
netseeker
sleepless reader
netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.
 
netseeker's Avatar
 
Posts: 4,763
Karma: 615547
Join Date: Jan 2008
Location: Germany, near Stuttgart
Device: Sony PRS-505, PB 360° & 302, nook wi-fi, Kindle 3
Quote:
Originally Posted by mtravellerh View Post
Nimmst Du eine universelle Sprache für das GUI (beispielsweise Java oder Python), damit wir anderen Pinguine auch teilhaben können?
Wenn nichts dagegenspricht, greife ich üblicherweise zu Java. Das kommt aber eher daher, weil ich in den letzten 11 Jahren beruflich überwiegend im Java- und JavaEE-Bereich unterwegs war/bin. Aber egal, was die Programmiersprache bzw. das Runtime-Framework auch sein wird, es wird mit Sicherheit so plattformunbhängig wie möglich sein.
netseeker is offline   Reply With Quote
Reply

Thread Tools Search this Thread
Search this Thread:

Advanced Search

Forum Jump

Similar Threads
Thread Thread Starter Forum Replies Last Post
Inhaltsverzeichnis unter Calibre?? - und andere Probleme bei der Ebook-Erstellung Momo_Germany Erste Hilfe 4 05-26-2009 04:38 PM
Philosophy Nietzsche, Friedrich: Der Wanderer und sein Schatten. v1 23 may 2009 german stahanovez Kindle Books 0 05-23-2009 01:38 PM
Philosophy Nietzsche, Friedrich: Der Wanderer und sein Schatten. v1.1 24 may 2009 german stahanovez ePub Books 0 05-23-2009 01:37 PM
Short Fiction Laßwitz, Kurd: Auf der Seifenblase und andere Erzählungen. german. v1. 04 mar 2009 netseeker ePub Books 0 03-04-2009 05:35 PM
Short Fiction Laßwitz, Kurd: Auf der Seifenblase und andere Erzählungen. german. v1. 04 mar 2009 netseeker Kindle Books 0 03-04-2009 05:34 PM


All times are GMT -4. The time now is 08:43 AM.


MobileRead.com is a privately owned, operated and funded community.