Register Guidelines E-Books Search Today's Posts Mark Forums Read

Go Back   MobileRead Forums > Non-English Discussions > Deutsches Forum > PocketBook

Notices

View Poll Results: Braucht ihr eine Volltextsuche über alle Bücher?
Ja, eine Volltextsuche wäre sinnvoll 17 60.71%
Nein, ich benötige keine Volltextsuche 11 39.29%
Voters: 28. You may not vote on this poll

Reply
 
Thread Tools Search this Thread
Old 01-09-2010, 05:24 AM   #1
Moredread
Addict
Moredread has learned how to read e-booksMoredread has learned how to read e-booksMoredread has learned how to read e-booksMoredread has learned how to read e-booksMoredread has learned how to read e-booksMoredread has learned how to read e-booksMoredread has learned how to read e-books
 
Posts: 202
Karma: 754
Join Date: Nov 2009
Device: Trekstore Pyrus
Volltextsuche im Pocketbook-Reader

Hi,

ich wäre persönlich sehr an einer Volltextsuche in Pocketbook-Readern interessiert, mit der sich alle Bücher auf einen Schlag durchsuchen lassen. Mich persönlich würde das eher im Pocketbook 901 reizen, da ich dieses eher für Fachliteratur nutze als das 360°, aber auch in den kleinen Readern wäre es ein durchaus interessantes Feature. Es wäre interessant zu erfahren, wer eine entsprechende Funktion für sinnvoll erachten würde - daher habe ich einen Poll angehängt.

Am sinnvollsten wäre es meines Erachtens, wenn eine bereits existente Software dafür benutzt würde. Es kann ja durchaus sein, das es für Linux bereits eine entsprechende Software gibt. Der Haken ist, das sich das Pocketbook wenig dafür eignet, im Hintergrund eine mySQL-Datenbank laufen zu lassen. Bei nur 64 MB RAM wird es da schnell eng mit den Ressourcen. Die Software müsste also den Index selbst in Dateien verwalten.

Sollte es eine solche Software also nicht geben - und sollten den GfK das ganze als zu aufwändig erscheinen - könnte ich mir durchaus vorstellen, so eine Software selbst zu programmieren. Ich habe vor zig Jahren einmal einen Algorithmus entwickelt, der diese Aufgabe stemmen könnte. Ich habe den Quellcode allerdings nicht mehr, wohl aber die Idee, wie er funktioniert.

Aus meiner Sicht gibt es an der Sache zwei Haken. Zum einen habe ich noch nie irgend etwas unter Linux entwickelt. Ich habe nicht den Hauch eines blassen Schimmers, was ich da genau machen muss. Das zweite Problem, vor dem ich genauso ahnungslos stehe, ist, wie bestimmte Formate verarbeitet werden. Das bedeutet, ich weiß zwar, wie ich bspw. eine Text-Datei oder HTML durchsuche - aber keinen Plan, was ich machen muss, um bspw. ein PDF zu erfassen. Möglicherweise gibt es dafür ja Module, die man einbinden kann. Alles selbst zu programmieren erscheint mir erst einmal recht aufwändig. Kurz und gut, ich benötige dafür die Unterstützung von jemanden, der Ahnung davon hat, wie man unter Linux bestimmte Sachen macht.

Zum Funktionsumfang: Die Software würde es ermöglichen, eine Volltextsuche nach Buchstaben oder Zahlen (oder einer Kombination von beidem) zu ermöglichen. Sonderzeichen wären außen vor - eine Suche nach dem String #>; wäre bspw. nicht möglich.

Die Indizierung müsste aus Performancegründen manuell angestoßen werden. Mir persönlich schwebt da ausschließlich eine Vollindizierung vor; weder ein automatisches Update noch ein manuelles Update wären vorgesehen, was damit zusammenhängt, wie die Dateien, in denen der Index eingetragen ist, aufgebaut sind. Man könnte so etwas zwar einprogrammieren, aber es wäre ziemlich aufwändig. Die Suche in einem bestimmten Ordner wäre möglich, würde aber genauso viel Zeit in Anspruch nehmen, wie die Suche in allen Büchern. Über den Daumen gepeilt sollten sich 2 GB Bücher (ohne Bilder) in knapp 10 Sekunden durchsuchen lassen.

Wie sieht es aus? Besteht bei euch Interesse an so einer Funktion? Nur für mich selbst werde ich es nicht programmieren. Ich kann so eine Funktion zwar brauchen, aber der Zeitaufwand wäre mir dann doch zu hoch. Wer würde mir helfen? Und - natürlich noch wichtiger - wie sieht es bei Pocketbook Global aus? Forkosigan: Ist so eine Funktion für die Zukunft geplant? In dem Falle lege ich nämlich lieber die Füsse hoch und warte.

Achja: Ich könnte damit nicht heute anfangen. Und selbst, wenn ich es tun würde, würde es einige Zeit in Anspruch nehmen. Also selbst, wenn der Vorschlag auf Begeisterung stößt und sich jemand findet, der mich unterstützt, müsstet ihr eine Weile darauf warten.

ciao

JM
Moredread is offline   Reply With Quote
Old 01-09-2010, 06:01 AM   #2
gulu-gulu
Guru
gulu-gulu knows how to set a laser printer to stun.gulu-gulu knows how to set a laser printer to stun.gulu-gulu knows how to set a laser printer to stun.gulu-gulu knows how to set a laser printer to stun.gulu-gulu knows how to set a laser printer to stun.gulu-gulu knows how to set a laser printer to stun.gulu-gulu knows how to set a laser printer to stun.gulu-gulu knows how to set a laser printer to stun.gulu-gulu knows how to set a laser printer to stun.gulu-gulu knows how to set a laser printer to stun.gulu-gulu knows how to set a laser printer to stun.
 
gulu-gulu's Avatar
 
Posts: 625
Karma: 95690
Join Date: Dec 2009
Location: Irgendwo im Nirgendwo hinter Nürnberg
Device: Kindle
Volltextsuche ist vielleicht teilweise praktisch, aber ich hatte bisher beim analog-Lesen auch noch nie das Bedürfnis einen Volltext zu suchen.. insofern von mir ein persönliches "nein, ich brauchs nicht".
gulu-gulu is offline   Reply With Quote
Advert
Old 01-09-2010, 06:03 AM   #3
mtravellerh
book creator
mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.mtravellerh ought to be getting tired of karma fortunes by now.
 
mtravellerh's Avatar
 
Posts: 9,635
Karma: 3856660
Join Date: Oct 2008
Location: Luxembourg
Device: PB360°
Habe nicht abgestimmt, weil ich eine Volltextsuche innerhalb eines Buches wohl nützlich und notwendig finde (gibt es ja sowieso in der PB-Firmware), Volltextsuche in allen Büchern gleichzeitig aber wirklich nicht brauche!
mtravellerh is offline   Reply With Quote
Old 01-09-2010, 06:46 AM   #4
Ulli
(-:
Ulli is no ebook tyro.Ulli is no ebook tyro.Ulli is no ebook tyro.Ulli is no ebook tyro.Ulli is no ebook tyro.Ulli is no ebook tyro.Ulli is no ebook tyro.Ulli is no ebook tyro.Ulli is no ebook tyro.Ulli is no ebook tyro.
 
Ulli's Avatar
 
Posts: 667
Karma: 1310
Join Date: Nov 2009
Location: Frankonia
Device: PocketBook 360°,302
Quote:
Originally Posted by mtravellerh View Post
Habe nicht abgestimmt, weil ich eine Volltextsuche innerhalb eines Buches wohl nützlich und notwendig finde (gibt es ja sowieso in der PB-Firmware), Volltextsuche in allen Büchern gleichzeitig aber wirklich nicht brauche!
Habe auch mit "nein" abgestimmt. Hätte es genauso gesagt.
Ulli is offline   Reply With Quote
Old 01-09-2010, 07:40 AM   #5
netseeker
sleepless reader
netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.
 
netseeker's Avatar
 
Posts: 4,763
Karma: 615547
Join Date: Jan 2008
Location: Germany, near Stuttgart
Device: Sony PRS-505, PB 360° & 302, nook wi-fi, Kindle 3
@Moredred und die PB-Entwickler: Schaut euch doch mal Lucy, die C-Portierung von Lucene an. Auch Beagle setzt bspw. darauf. Lucene ist wahrscheinlich das ausgereifteste OpenSource Suchframework und es ist keine DB o.ä. m Hintergrund notwendig. Die Suche über PDF's u.ä. ist relativ einfach: Man muss "nur" eine Plaintext-Representation hinbekommen um sie in den Suchindex aufzunehmen.
netseeker is offline   Reply With Quote
Advert
Old 01-09-2010, 07:43 AM   #6
netseeker
sleepless reader
netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.netseeker ought to be getting tired of karma fortunes by now.
 
netseeker's Avatar
 
Posts: 4,763
Karma: 615547
Join Date: Jan 2008
Location: Germany, near Stuttgart
Device: Sony PRS-505, PB 360° & 302, nook wi-fi, Kindle 3
Ach ja, habe natürlich mit "Ja" gestimmt, weil ich öfters nach bestimmten Themen/Stichwörtern suche und dann nie genau weiß, in welchen Büchern das vorkam. Das ist insbesondere bei Sachliteratur ganz schön unbequem.
netseeker is offline   Reply With Quote
Old 01-09-2010, 08:41 AM   #7
eibix
Groupie
eibix began at the beginning.
 
eibix's Avatar
 
Posts: 168
Karma: 34
Join Date: Nov 2009
Location: Wendelstein b. Nürnberg
Device: Kindle Touch, PocketBook 360
Auch ich habe mit 'Ja' gestimmt.

Ein großer Vorteil der Digitalisierung von Printmedien ist meiner Meinung nach gerade die Durchsuchbarkeit. Und die Suche sollte am 'Buchdeckel' nicht enden. Also meine Bitte an die Entwickler: Baut eine Volltextsuche in die Pocketbookreader ein. :-)
eibix is offline   Reply With Quote
Old 01-09-2010, 10:38 AM   #8
Sturgis
Groupie
Sturgis has a complete set of Star Wars action figures.Sturgis has a complete set of Star Wars action figures.Sturgis has a complete set of Star Wars action figures.Sturgis has a complete set of Star Wars action figures.Sturgis has a complete set of Star Wars action figures.
 
Sturgis's Avatar
 
Posts: 165
Karma: 496
Join Date: Nov 2009
Location: Germany
Device: Pocketbook 360, iPodTouch
Da ich hauptsächlich "einfach nur" Romane lese, habe ich eine Volltextsuche über alle Bücher bisher noch nicht vermisst.

Ich habe aber trotzdem mit "Ja" gestimmt, da ich so etwas grundsätzlich interessant fände. Gerade solche Funktionen sind doch ein Vorteil digitaler Lesesysteme. Sollte also jemand (oder vielleicht sogar die GfK) so eine Funktion in das Pocketbook programmieren, so fände ich das toll.
Sturgis is offline   Reply With Quote
Old 01-10-2010, 07:10 AM   #9
Moredread
Addict
Moredread has learned how to read e-booksMoredread has learned how to read e-booksMoredread has learned how to read e-booksMoredread has learned how to read e-booksMoredread has learned how to read e-booksMoredread has learned how to read e-booksMoredread has learned how to read e-books
 
Posts: 202
Karma: 754
Join Date: Nov 2009
Device: Trekstore Pyrus
Ich selber besitze praktisch alle Bücher, die ich "analog" hier rumliegen habe, auch digital. Kaufe ich mir ein Fachbuch, digitalisiere ich es notfalls selbst. Ich benutze die Suchfunktion wirklich recht häufig; das war auch der Hintergrundgedanke bei der Sache. Für die Suche in wissenschaftlichen Werken ist so etwas praktisch unbezahlbar...

Quote:
Originally Posted by netseeker View Post
@Moredred und die PB-Entwickler: Schaut euch doch mal Lucy, die C-Portierung von Lucene an. Auch Beagle setzt bspw. darauf. Lucene ist wahrscheinlich das ausgereifteste OpenSource Suchframework und es ist keine DB o.ä. m Hintergrund notwendig. Die Suche über PDF's u.ä. ist relativ einfach: Man muss "nur" eine Plaintext-Representation hinbekommen um sie in den Suchindex aufzunehmen.
Supergut! Ich habe wirklich wenig Lust, das Rad noch einmal neu erfinden zu müssen. Wenn es also so etwas schon gibt, wäre ich doch sehr dafür, es zu verwenden. Hm, wenn ich demnächst etwas Zeit habe, werde ich mich mal mit dem SDK auseinandersetzen und gucken, ob sich dieses Programm portieren lässt. Ich vermute stark, das es hauptsächlich eine Frage der benötigten Hardwareleistung ist.
Moredread is offline   Reply With Quote
Old 01-10-2010, 07:21 AM   #10
StephanE
Enthusiast
StephanE has learned how to buy an e-book online
 
StephanE's Avatar
 
Posts: 33
Karma: 94
Join Date: Dec 2009
Location: Germany
Device: PocketBook 360°
Ich habe mit Nein gestimmt, da ich auf dem Gerät lediglich Romane lese. Sinnvoll ist es tatsächlich nur, wenn man Sachtexte hat und diese durchsuchen möchte, um einen Sachverhalt nachzuschlagen.

Ergänzung: Ich denke, der beschränkende Faktor ist die mangelnde Hardwareleistung, ich habe testweise die Suchfunktion mal probiert und es hat lange gedauert, bis das Ergebnis erschien. Die Such auf alle Bücher auszudehnen scheint mir bei deser Hardwareplattform nicht sinnvoll, am PC ist das schon was anderes...

Last edited by StephanE; 01-10-2010 at 07:23 AM. Reason: Ergänzung angefügt
StephanE is offline   Reply With Quote
Old 01-10-2010, 07:41 AM   #11
Moredread
Addict
Moredread has learned how to read e-booksMoredread has learned how to read e-booksMoredread has learned how to read e-booksMoredread has learned how to read e-booksMoredread has learned how to read e-booksMoredread has learned how to read e-booksMoredread has learned how to read e-books
 
Posts: 202
Karma: 754
Join Date: Nov 2009
Device: Trekstore Pyrus
Die Suchfunktion innerhalb der Bücher ist auch eine "rohe" Volltextsuche. Wenn die Suchsoftware einen Index durchsucht, lässt sich jedes Buch unter einer Sekunde durchsuchen. Wie bereits geschrieben, schätze ich das 2 GB reiner Text sich in knapp 10 Sekunden durchsuchen lassen. Meine Suchfunktion lief damals auf PCs mit geringerer Hardwareleistung als die des Pocketbooks (200 MHz-Rechner) sogar noch schneller.
Moredread is offline   Reply With Quote
Old 01-11-2010, 05:14 PM   #12
rasch
Connoisseur
rasch has a complete set of Star Wars action figures.rasch has a complete set of Star Wars action figures.rasch has a complete set of Star Wars action figures.rasch has a complete set of Star Wars action figures.
 
rasch's Avatar
 
Posts: 77
Karma: 376
Join Date: Jan 2010
Device: 2x PB 301+ 1xPB602 1xPB701 1xSonie PRS350
Alternativer Lösungsansatz:

Hallo Leute,
ich möchte euch nicht frustrieren aber ich denke das man zu der Zeit in der z.B. ein 200 Mhz mmx gewerkelt haben die Festplatten gerade mal 2 GB hatten. Die Datenmengen die man damals durchsucht / indiziert hat waren sicher auch groß, aber es waren sicher nicht gleich Bibliothekenweise.

So mal auf die schnelle 2 GB ins RAM kippen ( Der Bus fährt auf den Embedded Kisten nicht so schnell und 512 Bit is er sicher auch nicht breit ) oder permanent da drin halten ist mit der momentanen eBook Reader HW auch nicht wirklich drin.
Man kämpft da eher mit der Reduzierung von Stromaufnahme und Schreibzyklen auf Flash Speicher, chronischem Hauptspeichermangel ....

Es wäre sicher schön, aber der Charme dieser Hardware liegt sicher nicht in der Fähigkeit sich wie ein großer Server zu verhalten.
( wäre doch schade wenn man da noch ein AKW und Klimaanlage für die Abwärme betreiben müsste )

Für machbarer halte ich da, das man außerhalb Index Dateien mit (z.B. fachlich) Interessanten Wörtern vorbereitet. So bekommt dann jedes (von außen) durchsuchbare Dokument eine von der Größe überschaubare/händelbare Indexdatei mit.
( das wäre dann aber erstmal eine proprietärer Sache (evtl. ergänzend zu den bestehenden Formaten) )
So etwas aufzubauen erfordert aber erstmal ziemlich viel Eigenarbeit.
Für den Eigenbedarf viel Aufwand, aber für ne Comunity durchaus denkbar

PS
Wenn Du das was Du nicht suchst auch nicht ( seitenweise ) wegscrollen/blättern musst bist Du auch schneller bei den Infos die Du suchst. ( Wenn sie denn dabei sind )

gRuss Ralf
rasch is offline   Reply With Quote
Old 01-11-2010, 06:32 PM   #13
Moredread
Addict
Moredread has learned how to read e-booksMoredread has learned how to read e-booksMoredread has learned how to read e-booksMoredread has learned how to read e-booksMoredread has learned how to read e-booksMoredread has learned how to read e-booksMoredread has learned how to read e-books
 
Posts: 202
Karma: 754
Join Date: Nov 2009
Device: Trekstore Pyrus
Quote:
Originally Posted by rasch View Post
Hallo Leute,
ich möchte euch nicht frustrieren aber ich denke das man zu der Zeit in der z.B. ein 200 Mhz mmx gewerkelt haben die Festplatten gerade mal 2 GB hatten. Die Datenmengen die man damals durchsucht / indiziert hat waren sicher auch groß, aber es waren sicher nicht gleich Bibliothekenweise.
Ich hatte damals eine 20 GB Festplatte auf einem 133 MHZ Rechner. Um alle Bücher zu durchsuchen, muss ich nicht ein einziges dieser Bücher öffnen. Eben dazu gibt es ja einen Suchindex, der nur ein Bruchteil der Bücher groß ist. Derzeit habe ich ca. 50 GB Text (ein Teil davon sind Foren, die mittlerweile offline sind) und die lassen sich unter einer Sekunde durchsuchen (mittels Copernic Desktop Search). Wo sollte da das Problem sein? Indizierung beherrscht bspw. Windows ja schon aus dem FF. Hatte ich ja auch schon geschrieben.



Quote:
Originally Posted by rasch View Post
So mal auf die schnelle 2 GB ins RAM kippen ( Der Bus fährt auf den Embedded Kisten nicht so schnell und 512 Bit is er sicher auch nicht breit ) oder permanent da drin halten ist mit der momentanen eBook Reader HW auch nicht wirklich drin.
Das wäre ja auch völlig unnötig. Wie gesagt, der Index ist kleiner - und er muss zur Suche nicht einmal komplett geladen werden.



Quote:
Originally Posted by rasch View Post
Es wäre sicher schön, aber der Charme dieser Hardware liegt sicher nicht in der Fähigkeit sich wie ein großer Server zu verhalten.
( wäre doch schade wenn man da noch ein AKW und Klimaanlage für die Abwärme betreiben müsste )
Die Stärken eines Index liegen eben darin, das nicht sämtliche Bücher durchsucht werden müssen, sondern lediglich ein entsprechend strukturierter Index, der dann auch wieder nur teilweise durchsucht werden muss. Ein Index ist eine Art Abkürzung für eine Suchfunktion.



Quote:
Originally Posted by rasch View Post
Für machbarer halte ich da, das man außerhalb Index Dateien mit (z.B. fachlich) Interessanten Wörtern vorbereitet. So bekommt dann jedes (von außen) durchsuchbare Dokument eine von der Größe überschaubare/händelbare Indexdatei mit.
( das wäre dann aber erstmal eine proprietärer Sache (evtl. ergänzend zu den bestehenden Formaten) )
So etwas aufzubauen erfordert aber erstmal ziemlich viel Eigenarbeit.
Für den Eigenbedarf viel Aufwand, aber für ne Comunity durchaus denkbar
Eine Software, die das bei Textdateien schafft, kann ich an einem Wochenende programmieren. Sie würde Indexdateien vollautomatisiert erstellen. Allerdings wirft dieser Ansatz eine Menge Probleme auf, bspw. bei der Suche nach Wortteilen oder Satzfragmenten. Gut möglich, das ich etwas ähnliches im ersten Anlauf mache. Mein Indexsystem ist allerdings wesentlich komplexer - und hat den Vorteil, das es sich nicht so schnell aus der Ruhe bringen lässt wie ein Index, der für jedes Buch eine eigene Datei durchsuchen muss. Das ist aber einer bestimmten Anzahl Bücher nicht mehr tragbar, da alleine das öffnen der Indexdateien irrsinnig viel Zeit verschlingen würde.

Zerbrich Dir nicht den Kopf darüber, wie so ein Algorithmus funktioniert (es sei denn, Du willst einen programmieren ). Das Ding habe ich auch nicht an einem Tag erfunden. Wenn man einmal dahintergekommen ist, kann man es aber ziemlich leicht realisieren.



Quote:
Originally Posted by rasch View Post
Wenn Du das was Du nicht suchst auch nicht ( seitenweise ) wegscrollen/blättern musst bist Du auch schneller bei den Infos die Du suchst. ( Wenn sie denn dabei sind )
Um den Problem zu entgehen, das ein Wort überall vorkommt (beispielsweise: der, die, das, ich, du, er, sie, es usw. usw.) gibt es verschiedene Lösungsansätze. Entweder werden solche Wörter durch einen Filter aussortiert (natürlich automatisch, ohne, das man diese Worte alle in einen Filter eingeben muss, Sprache besteht nämlich zu einem sehr großen Teil nur aus nutzlosen Füllwörtern, jedenfalls aus Sicht eines Programms, das Sprache irgendwie analysieren muss). Oder aber man strukturiert den Index von vorneherein so, das dieses Problem gar nicht erst auftreten kann. Was ich genau machen werde, hängt von der Leistung der Hardware ab - und welches System einerseits eine akzeptable Performance erreicht und andererseits in einem akzeptablen Zeitrahmen bleibt.
Moredread is offline   Reply With Quote
Reply

Thread Tools Search this Thread
Search this Thread:

Advanced Search

Forum Jump

Similar Threads
Thread Thread Starter Forum Replies Last Post
don't buy pocketbook reader rangrang PocketBook 111 11-08-2012 12:41 PM
The Green Reader - PocketBook official shop in UK! jules_july PocketBook 6 05-07-2010 06:13 PM
PocketBook 360° - new 5" ebook reader Nate the great News 88 04-29-2010 12:59 PM
Pocketbook Global launches new reader at CEBIT Forkosigan PocketBook 21 02-22-2010 01:34 AM


All times are GMT -4. The time now is 10:02 AM.


MobileRead.com is a privately owned, operated and funded community.