Quote:
Originally Posted by Matthias4
Übrigens, die komplette Datei kann auf der Seite http://www.archive.org/details/spiritualwives00dixorich herunter geladen werden. Es ist unter "View the book" gleich die erste PDF-Datei. Auf vielen Seien steht "Univ Calif - Digitized by Microsoft". Offensichtlich wurde sie im Rahmen des später eingestellen Buchprojekts von Microsoft, das als Konkurrenz zur Google Buchsuche gedacht war, eingescannt. Dieses Projekt wurde eingestellt, die schon eingescannten Bücher sind aber noch vorhanden.
|
In dieser PDF-Variante wurden die Fonts aus dem alten Dokument erzeugt und eingebettet d.h. der Text wurde intern in einzelne Abschnitte segmentiert, die Textzeilen seperat gerastert, um anschliessend nochmals in die einzelnen Buchstaben zu segmentieren und zu rastern und schießlich dann als Bild pro Buchstabe im PDF gespeichert,- damit ist es möglich die originalen Buchstaben aus alten Dokumenten (1886 in deinem referenzierten Dokument) zu rekonstruieren und darüber hinaus durchsuchbar zu machen, wenn zum Buchstabenbild eine zusätzliche Referenz z.B. zum korrespondierenden ASCII-Code codiert ist. Anders als alte Bücher, dessen komplette Buchseiten als eingescanntes Bild gespeichert werden