View Single Post
Old 05-18-2011, 07:46 AM   #3
Hokuspokus
Fidibus
Hokuspokus ought to be getting tired of karma fortunes by now.Hokuspokus ought to be getting tired of karma fortunes by now.Hokuspokus ought to be getting tired of karma fortunes by now.Hokuspokus ought to be getting tired of karma fortunes by now.Hokuspokus ought to be getting tired of karma fortunes by now.Hokuspokus ought to be getting tired of karma fortunes by now.Hokuspokus ought to be getting tired of karma fortunes by now.Hokuspokus ought to be getting tired of karma fortunes by now.Hokuspokus ought to be getting tired of karma fortunes by now.Hokuspokus ought to be getting tired of karma fortunes by now.Hokuspokus ought to be getting tired of karma fortunes by now.
 
Posts: 441
Karma: 2246533
Join Date: Feb 2010
Device: none
Ja, die Scans im Netz sind häufig ziemlich schlecht. Gutenberg DE z.B. macht deshalb prinzipiell eigene Scans, weil man nur so ein brauchbares OCR Ergebnis bekommt.

Nun, die Scans sind da, sie sind besser als nichts und sie sind umsonst. Für viele der Bücher aus dem 19ten Jahrhundert sind sie die einzige Chance, überhaupt noch gelesen zu werden und für uns die einzige Chance, sie zu lesen. Also nutzen wir sie, so weit das geht, und hoffen auf bessere Technik in der Zukunft.

Die Scans habe ich von Hand jede Seite einzeln beschnitten. Das klingt schlimmer, als es ist, denn es gibt ein Tool, das einem viel Arbeit abnimmt: Autohotkey http://de.autohotkey.com/
Damit kann man Scripts erstellen und ausführen, die Tastendruck oder Mausklick an den Computer senden.

Zum Bearbeiten habe ich Irfanview verwendet http://www.chip.de/downloads/IrfanView_12998187.html

Zunächst habe ich die Bilder aus dem PDF extrahiert. Das geht mit Calibre (nach epub konvertieren und nach zip umbenennen) oder mit pdfill http://www.chip.de/downloads/PDFill-..._44529795.html
Das pdfill Tool ist wesentlich schneller. Beide Möglichkeiten liefern aber bei Bildern oder unklaren Seiten einfach eine weiße Seite. Die muss man dann mit der Foto Funktion in einem beliebigen PDF Betrachter ergänzen. Das habe ich leider erst recht spät bemerkt. Der Todesengel hat deshalb leider mindestens eine fehlende Seite.

Von Hand würde man jetzt das erste Bild öffnen, den Schnittbereich markieren, ausschneiden, speichern und das nächste Bild öffnen. Abgesehen vom Markieren des Schnittbereichs lasse ich alles von dem Hotkey Scirpt machen. Ich muss nur noch zwei Tasten drücken und fertig.

Das ist das Script:
Quote:
;snip ********************************************
;
; AutoHotkey Version: 1.x
; Language: English
; Platform: Win7
; Author: Hokuspokus
;
; Script Function:
; gescante Buchseiten beschneiden
;

#NoEnv ; Recommended for performance and compatibility with future AutoHotkey releases.
SendMode Input ; Recommended for new scripts due to its superior speed and reliability.
SetWorkingDir %A_ScriptDir% ; Ensures a consistent starting directory.

;cut:
SC03A & a::
{
Send, ^y
Send, ^s
MouseClick, left, xxx, yy

}
Return

;snap ******************************************
Code in ein txt file copieren, speichern und die txt Datei in wasauchimmer.ahk umbenennen. Doppelklick startet das Script, dass sich dann als grünes H im Systemtray aufhält. Ausgelöst wird es, in dem man gleichzeitig Capslock und a drückt. Da es einen Mausklick auf eine bestimmte Stelle des Bildschirms emuliert (auf den Pfeil, der die nächste Datei im Verzeichnis öffnet), muss es an den jeweiligen Bildschirm angepasst werden. Bei Autohotkey ist ein Tool dabei, mit dem man die genau Position ermitteln kann. Die Werte müssen in der grünen Zeile entsprechend geändert werden. Man kann das Script natürlich auch auf andere Bildbearbeitungsprogramme anpassen.

Archive.org ist inzwischen auch mit der automatischen Bearbeitung fertig geworden. Über die Titel kann man jetzt die entsprechenden PDFs runterladen.
Hokuspokus is offline   Reply With Quote