|
|||||||
|
You are currently viewing our boards as a guest which gives you limited access to view most discussions and access our other features. By joining our free community today, you will have fewer ads, access to post topics, communicate privately with other members, respond to polls, upload content and access many other special features. If you have any problems with the registration process or your account login, please contact us. Hint: Don't have time to visit us daily? Subscribe to our main RSS feed to receive our frontpage posts at your convenience. |
| Software Tipps, Tools und Scripts |
![]() |
|
|
Thread Tools | Search this Thread | Display Modes |
|
|
#1 |
|
book creator
![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]()
Posts: 6,642
Karma: 22474
Join Date: Oct 2008
Location: Luxembourg
Device: PocketBook 360°, Cool-er, Ipod Touch
|
OCR-Software für altdeutsche Schrift
Ich möchte hier mal eine Aufruf starten, vielleicht hab ich ja Glück.
Also: Ich habe sämtliche Abenteuer des Detektiv Nobody in altdeutscher Schrift(PDF). Ich weiss. dass es von Abbyy OCR-Software gibt, die diese Schrift lesen kann, aber ich kann sie mir leider nicht leisten. Daher möchte ich gerne wissen, ob jemand diese Software hat und die PDFs durchlaufen lassen könnte (zu HTML oder TXT) Ich würde das K-Lesen übernehmen. Bitte per PM melden ode hier rein schreiben. Falls ich niemanden finde, muss ich wohl oder übel den ganzen Text abschreiben und das wär nun wirklich sehr aufwändig. Danke im Voraus MTH |
|
|
|
|
|
#2 |
|
Palm Addict
![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]()
Posts: 475
Karma: 953
Join Date: Aug 2008
Device: Cybook Gen3 [512mb, FW: 1.5]
|
Vom Finereader 9 gibt's eine demo-Version.
Sie läßt sich soweit ich weiß 15 Tage nutzen und verarbeitet bis zu 50 Seiten auf einmal. Wenn du das Ergebnis danach in HTML (oder andere Formate) exportierst (und eventuell zusammensetzt) sollte es Dir viel Zeit sparen. |
|
|
|
|
|
#3 |
|
book creator
![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]()
Posts: 6,642
Karma: 22474
Join Date: Oct 2008
Location: Luxembourg
Device: PocketBook 360°, Cool-er, Ipod Touch
|
Danke. Ich werd das mal probieren.
|
|
|
|
|
|
#4 |
|
sleepless reader
![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]()
Posts: 3,196
Karma: 10835
Join Date: Jan 2008
Location: Germany
Device: Sony PRS 505 (blue), iPod touch, Palm Prè, PocketBook 360° (very soon)
|
Tesseract ist Open Source und hat Unterstützung und Trainingsdaten sowohl für moderne deutsche Schrift als auch für die Frakturschrift:
Habs noch nicht getestet, werde das aber jetzt machen, da ich ebenfalls Bedarf am OCR von Frakturschrift habe. Wahrscheinlich werden die Ergebnisse aber schlechter wie bei Finereader & Co sein...umständlicher ist es allemal. |
|
|
|
|
|
#5 | |
|
sleepless reader
![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]()
Posts: 3,196
Karma: 10835
Join Date: Jan 2008
Location: Germany
Device: Sony PRS 505 (blue), iPod touch, Palm Prè, PocketBook 360° (very soon)
|
Habe es mit 2 verschiedenen Büchern, welche unterschiedliche Frakturschriftarten benutzen mal getestet und war ganz positiv überrascht. Naja, so positiv wie man bei einem kostenlosen OCR und dann noch mit Frakturschrift halt sein kann.
![]() Zuerst muss man die PDF-Inhalte als tif-Grafiken bekommen, dann kann man Tesseract via Quote:
Anbei mal die Resultate der ersten zwei Seiten vom Detektiv Nobody 5. Das Ergebnis der ersten Seite ist aufgrund des Drop-Cap am ersten Absatz natürlich zwangsläufig nicht so gut. Die zweite Seite sieht besser aus. Keine Ahnung wie sich der Finereader da schlägt - vielleicht kann ja mal jemand einen Vergleich posten... |
|
|
|
|
|
|
#6 |
|
Palm Addict
![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]()
Posts: 475
Karma: 953
Join Date: Aug 2008
Device: Cybook Gen3 [512mb, FW: 1.5]
|
In dem Fall solltet Ihr mal das testen: http://www.frakturschrift.de/
Der gewöhnliche Finereader bräuchte auch eine Musterdatei um brauchbare Ergebnisse zu liefern, die sollten hier schon dabei sein. |
|
|
|
|
|
#7 | |
|
book creator
![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]()
Posts: 6,642
Karma: 22474
Join Date: Oct 2008
Location: Luxembourg
Device: PocketBook 360°, Cool-er, Ipod Touch
|
Quote:
|
|
|
|
|
|
|
#8 |
|
sleepless reader
![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]()
Posts: 3,196
Karma: 10835
Join Date: Jan 2008
Location: Germany
Device: Sony PRS 505 (blue), iPod touch, Palm Prè, PocketBook 360° (very soon)
|
Beim Trainieren von Tesseract hilft unter Windows JTesseract, eine überraschend komfortable GUI, ungemein...
|
|
|
|
|
|
#9 |
|
book creator
![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]()
Posts: 6,642
Karma: 22474
Join Date: Oct 2008
Location: Luxembourg
Device: PocketBook 360°, Cool-er, Ipod Touch
|
Danke nochmal. Bin schon fleissig am OCRen (oder wie immer das heisst). Funktioniert überraschend gut!
|
|
|
|
|
|
#10 |
|
Palm Addict
![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]()
Posts: 475
Karma: 953
Join Date: Aug 2008
Device: Cybook Gen3 [512mb, FW: 1.5]
|
optical character recognition = optische Zeichenerkennung
|
|
|
|
![]() |
| Thread Tools | Search this Thread |
| Display Modes | |
|
Similar Threads
|
||||
| Thread | Thread Starter | Forum | Replies | Last Post |
| Zeitung für nen eReader? | Lorion | Deutsches Forum | 9 | 06-06-2009 05:14 PM |
| Bücher für Reader formatieren | Stefan S. | Sony Reader | 1 | 09-11-2008 05:26 AM |
| OCR to use | pepak | Workshop | 17 | 05-26-2008 06:30 PM |
| What is an OCR Cradle? | JackieFrost | Which one should I buy? | 4 | 05-21-2008 09:10 PM |
| Why would you use OCR for a 2007 book? | Barcey | News and Commentary | 4 | 11-10-2007 02:57 PM |