Register Guidelines E-Books Search Today's Posts Mark Forums Read

Go Back   MobileRead Forums > Non-English Discussions > Deutsches Forum > Software

Notices

Reply
 
Thread Tools Search this Thread
Old 08-29-2010, 10:20 AM   #1
Zel
Zealot
Zel began at the beginning.
 
Zel's Avatar
 
Posts: 119
Karma: 10
Join Date: May 2010
Location: NRW, Germany
Device: Pocketbook 360° + Kindle 3
Calibre: Seitenzahlen von pdf in epub/mobi entfernen

Hallo zusammen!

Ich habe (egal mit welcher Calibre-Version) das Problem, dass ich die in pdf-Büchern eingebundenen Seitenzahlen (meistens unten auf jeder Seite (mittig oder zentriert) bei der Konventierung zu epub/mobi nicht wegbekomme und sie somit mitten im eigentlichen Text landen.

Mache ich bei der Anwendung des "Zauberstabs" (oder wie Calibre das nennt) etwas falsch? Oder kann das Calibre einfach noch nicht?

Habe leider keine Ahnung von "Befehlkommandos" (die man anscheinend bei Calibre eingeben kann/soll)...

Wie werdet ihr die Seitenzahlen bei pdf-Dokumenten los?

Gruß, Zel
Zel is offline   Reply With Quote
Old 08-29-2010, 02:14 PM   #2
Manichean
Wizard
Manichean My eyes! My eyes! The light is just too bright!Manichean My eyes! My eyes! The light is just too bright!Manichean My eyes! My eyes! The light is just too bright!Manichean My eyes! My eyes! The light is just too bright!Manichean My eyes! My eyes! The light is just too bright!Manichean My eyes! My eyes! The light is just too bright!Manichean My eyes! My eyes! The light is just too bright!Manichean My eyes! My eyes! The light is just too bright!Manichean My eyes! My eyes! The light is just too bright!Manichean My eyes! My eyes! The light is just too bright!Manichean My eyes! My eyes! The light is just too bright!
 
Manichean's Avatar
 
Posts: 3,130
Karma: 80446
Join Date: Feb 2008
Location: Germany
Device: Cybook Gen3
Welchen der Zauberstäbe benutzt Du denn? Sinnvoll in diesem Kontext wäre Entfernung von Fußzeile, denke ich.

Das, was Du "Befehlskommandos" (ist das nicht ein bißchen doppeltgemoppelt?) nennst, sind regular expressions. Eine übrigens auch im Calibre-Handbuch verlinkte Einführung ist hier zu finden.
Manichean is offline   Reply With Quote
Old 08-29-2010, 04:33 PM   #3
Zel
Zealot
Zel began at the beginning.
 
Zel's Avatar
 
Posts: 119
Karma: 10
Join Date: May 2010
Location: NRW, Germany
Device: Pocketbook 360° + Kindle 3
ja, ich meine den Zauberstab zur Entfernung der Fußzeile.
Vielleicht benutze ich den Zauberstab auch nur einfach falsch:
Ich mache ein Häkchen bei "Fußzeile entfernen" und das wars. Leider klappt es so nie.
Wenn ich dann noch auf den Zauberstab drücke, öffnet sich ein weiteres Fenster, wo ich dann aber nicht mehr weiß, was ich machen soll..
Zel is offline   Reply With Quote
Old 08-29-2010, 06:11 PM   #4
Manichean
Wizard
Manichean My eyes! My eyes! The light is just too bright!Manichean My eyes! My eyes! The light is just too bright!Manichean My eyes! My eyes! The light is just too bright!Manichean My eyes! My eyes! The light is just too bright!Manichean My eyes! My eyes! The light is just too bright!Manichean My eyes! My eyes! The light is just too bright!Manichean My eyes! My eyes! The light is just too bright!Manichean My eyes! My eyes! The light is just too bright!Manichean My eyes! My eyes! The light is just too bright!Manichean My eyes! My eyes! The light is just too bright!Manichean My eyes! My eyes! The light is just too bright!
 
Manichean's Avatar
 
Posts: 3,130
Karma: 80446
Join Date: Feb 2008
Location: Germany
Device: Cybook Gen3
Ah. Der Ausdruck, der da steht, ist (vermutlich, ich hab den noch nicht genauer angeguckt) auf Standard-Fußzeilen ausgelegt. Das Häkchen ist schonmal richtig, in dem Fenster, das sich dann öffnet, wird Dir der Quelltext des zu konvertierenden Buches angezeigt. Oben gibst Du dann die regular expression ein, die die Fußzeile bzw. Seitenzahl im Dokument beschreibt, und mittels der Schaltfläche "Test" zeigt Calibre dann, was es tatsächlich entfernen würde. Denk dran, entsprechende umschließende Tags mit zu entfernen.

EDIT: Konkretes, vielleicht anschaulicheres Beispiel: Angenommen, die Seitenzahlangabe ist "Seite X von Y" ohne weitere Tags. Dann wäre die regular expression, die Du für die Entfernung der Fußleiste angeben mußt, "Seite [0-9]+ von Y" (da Y eine feste Zahl ist, kann das direkt übernommen werden.) Siehe ansonsten den Link in meinem obigen Post- lies Dir den am Besten mal in Ruhe durch, das sollte einiges verdeutlichen.

Last edited by Manichean; 08-29-2010 at 06:19 PM. Reason: Beispiel angefügt
Manichean is offline   Reply With Quote
Old 08-30-2010, 03:54 AM   #5
Zel
Zealot
Zel began at the beginning.
 
Zel's Avatar
 
Posts: 119
Karma: 10
Join Date: May 2010
Location: NRW, Germany
Device: Pocketbook 360° + Kindle 3
Quote:
Originally Posted by Manichean View Post

EDIT: Konkretes, vielleicht anschaulicheres Beispiel: Angenommen, die Seitenzahlangabe ist "Seite X von Y" ohne weitere Tags. Dann wäre die regular expression, die Du für die Entfernung der Fußleiste angeben mußt, "Seite [0-9]+ von Y" (da Y eine feste Zahl ist, kann das direkt übernommen werden.) Siehe ansonsten den Link in meinem obigen Post- lies Dir den am Besten mal in Ruhe durch, das sollte einiges verdeutlichen.
Danke für das "EDIT" - Ohne das habe ich nämlich gar nichts verstanden.. ;-)
Werde mir deinen Link noch einmal genauer anschauen und anschließend probieren es mit Calibre umzusetzen..!
Zel is offline   Reply With Quote
Old 08-30-2010, 05:36 AM   #6
katzenstreik
Winged Ape
katzenstreik has a complete set of Star Wars action figures.katzenstreik has a complete set of Star Wars action figures.katzenstreik has a complete set of Star Wars action figures.
 
katzenstreik's Avatar
 
Posts: 128
Karma: 290
Join Date: May 2010
Location: Germany
Device: Kindle 2i
Quote:
Originally Posted by Zel View Post
Wie werdet ihr die Seitenzahlen bei pdf-Dokumenten los?
Der alte Trick: PDF -> html mit dem MobipocketCreator, html dann mit Calibre in gewünschtes eBook-Format trimmen.

Der MobipocketCreator schafft das mit den Seitenzahlen (und Kopf- und Fußzeilen) in der Regel recht gut...
katzenstreik is offline   Reply With Quote
Old 08-30-2010, 06:03 AM   #7
Zel
Zealot
Zel began at the beginning.
 
Zel's Avatar
 
Posts: 119
Karma: 10
Join Date: May 2010
Location: NRW, Germany
Device: Pocketbook 360° + Kindle 3
Quote:
Originally Posted by katzenstreik View Post
Der alte Trick: PDF -> html mit dem MobipocketCreator, html dann mit Calibre in gewünschtes eBook-Format trimmen.

Der MobipocketCreator schafft das mit den Seitenzahlen (und Kopf- und Fußzeilen) in der Regel recht gut...
Danke für den Tipp, aber soweit ich weiß, gibt es den MobipocketCreator (noch) nicht für den Mac und folglich kann ich ihn nicht verwenden..
Zel is offline   Reply With Quote
Old 09-04-2010, 03:21 PM   #8
2scanner
Junior Member
2scanner began at the beginning.
 
2scanner's Avatar
 
Posts: 2
Karma: 10
Join Date: Sep 2010
Device: iPod 3G 32GB
Danke für eure Diskussion,
hatte das gleiche Problem wie Zel, durch den Tipp von Manichean hab ich dann kapiert. Mein Eintrag für schlichte Seitenzahlen-Entfernung:

(([0-9]+ </p>)*([10-99]+ </p>)*([100-999]+ </p>))


Vorschautyp ePub, Staffelung der Zahlen weil Calibre [1-1000] nicht rafft.
Das </p>-Tag, weil auch sonst alle anderen Zahlen im Skript gelöscht würden.
2scanner is offline   Reply With Quote
Old 09-04-2010, 03:36 PM   #9
2scanner
Junior Member
2scanner began at the beginning.
 
2scanner's Avatar
 
Posts: 2
Karma: 10
Join Date: Sep 2010
Device: iPod 3G 32GB
Uups - P.S.:
Wenn Du erstmal "nur" das PDF hast, ist der Eintrag

(([0-9]+ <br>)*([10-99]+ <br>)*([100-999]+ <br>))

Bei mehr als tausend Seiten entsprechend erweitern
2scanner is offline   Reply With Quote
Old 09-05-2010, 05:25 AM   #10
Manichean
Wizard
Manichean My eyes! My eyes! The light is just too bright!Manichean My eyes! My eyes! The light is just too bright!Manichean My eyes! My eyes! The light is just too bright!Manichean My eyes! My eyes! The light is just too bright!Manichean My eyes! My eyes! The light is just too bright!Manichean My eyes! My eyes! The light is just too bright!Manichean My eyes! My eyes! The light is just too bright!Manichean My eyes! My eyes! The light is just too bright!Manichean My eyes! My eyes! The light is just too bright!Manichean My eyes! My eyes! The light is just too bright!Manichean My eyes! My eyes! The light is just too bright!
 
Manichean's Avatar
 
Posts: 3,130
Karma: 80446
Join Date: Feb 2008
Location: Germany
Device: Cybook Gen3
Hm, nach meinem Verständnis sollte eigentlich
Code:
[0-9]+ <br>
jede Zahlenkombination erschlagen- das + sagt "mindestens ein Auftreten der Zahlen 0-9". Die Angabe [10-99]+ würde dann so interpretiert "mindestens einmal entweder die 1, eine Zahl von 0-9 oder die 9". Kurz gesagt: Der Ausdruck in der ersten Klammer sollte reichen, wenn ich mich nicht irre.

EDIT: Anders ausgedrückt: Eine regexp "versteht" keine Zahlen sondern Zeichenketten. Mit [1-1000]+ hast Du also versucht zu sagen "mindestens einmal eine Zahl zwischen 1 und 1 oder die 0 oder die 0 oder die 0".

Last edited by Manichean; 09-05-2010 at 07:47 AM.
Manichean is offline   Reply With Quote
Old 09-22-2010, 11:38 AM   #11
Zel
Zealot
Zel began at the beginning.
 
Zel's Avatar
 
Posts: 119
Karma: 10
Join Date: May 2010
Location: NRW, Germany
Device: Pocketbook 360° + Kindle 3
Leider klappt es bei mir (PDF, unten mittig die Seitenzahl (nur die Zahl, keine Striche o.ä.), ca. 650 Seiten) mit keiner der oben beschriebenen Lösungen + auch nicht mit dem vorgeschlagenen Ausdruck von Calibre.

Entweder ich mache etwas falsch (sehr gut möglich, da wirklich keine Ahnung) oder es geht einfach nicht...

Soll ich wohl den Calibre-Chef ( = Erfinder) mal persönlich fragen, ob er zu diesem Thema nicht ein Video hochladen kann? ;-)
Zel is offline   Reply With Quote
Old 09-23-2010, 05:17 AM   #12
Manichean
Wizard
Manichean My eyes! My eyes! The light is just too bright!Manichean My eyes! My eyes! The light is just too bright!Manichean My eyes! My eyes! The light is just too bright!Manichean My eyes! My eyes! The light is just too bright!Manichean My eyes! My eyes! The light is just too bright!Manichean My eyes! My eyes! The light is just too bright!Manichean My eyes! My eyes! The light is just too bright!Manichean My eyes! My eyes! The light is just too bright!Manichean My eyes! My eyes! The light is just too bright!Manichean My eyes! My eyes! The light is just too bright!Manichean My eyes! My eyes! The light is just too bright!
 
Manichean's Avatar
 
Posts: 3,130
Karma: 80446
Join Date: Feb 2008
Location: Germany
Device: Cybook Gen3
Es gibt ein Tutorial, das versucht, reguläre Ausdrücke verständlich zu erklären. Die Regexpes, die da oben stehen, sind vermutlich für Dein Problem ungeeignet, weil der Code für die Seitenzahlen bei Dir einfach anders aussieht.
Manichean is offline   Reply With Quote
Old 09-23-2010, 07:09 AM   #13
K-Thom
Wizard
K-Thom ought to be getting tired of karma fortunes by now.K-Thom ought to be getting tired of karma fortunes by now.K-Thom ought to be getting tired of karma fortunes by now.K-Thom ought to be getting tired of karma fortunes by now.K-Thom ought to be getting tired of karma fortunes by now.K-Thom ought to be getting tired of karma fortunes by now.K-Thom ought to be getting tired of karma fortunes by now.K-Thom ought to be getting tired of karma fortunes by now.K-Thom ought to be getting tired of karma fortunes by now.K-Thom ought to be getting tired of karma fortunes by now.K-Thom ought to be getting tired of karma fortunes by now.
 
Posts: 3,302
Karma: 535819
Join Date: Oct 2008
Location: Berlin, Germany
Device: yup!
Die Schwierigkeit dabei ist, dass manche Seitenzahlen nicht als Fußzeilen bei der Konvertierung interpretiert werden. Das passiert sogar, wenn man aus Acrobat heraus in ein anderes Format abspeichert.

Ich rede mal jetzt in Word: Wenn du Glück hast, steht jede Seitenzahl in einer eigenen Zeile, also

^p1^p oder ^pSeite 1 von 1008^p oder Ähnliches. *^p=Zeilenumbruch

Dann lassen sie sich leicht manuell abfangen oder per Makro rauslöschen. Übelst wird es, wenn die Seitenzahlen in einer etwas anderen Formatierung in den Fließtext übergehen.

Die sicherste - aber aufwendigste - Methode ist und bleibt allerdings das manuelle Rauslöschen. Sonst kann es dir passieren, dass du solche Textstellen plötzlich automatisch mitlöscht.

"Der Countdown läuft", brüllte der Offizier durch den Raum.
10 ... 9 ... 8
Sergeant Thomlin lief der Schweiß von der Stirn
7 ... 6 ... 5
Nervosität machte sich unter den Männern breit.


oder

Hastig zählte er seine Schritte, um den Fallen zu entgehen.
17, 18, 19 ...
Hatte er richtig gezählt?
18?
Mitten in der Bewegung hielt er inne.


PDFs sind einfach eine Katastrophe, wenn's ums Konvertieren geht.
K-Thom is offline   Reply With Quote
Old 09-23-2010, 11:24 AM   #14
Zel
Zealot
Zel began at the beginning.
 
Zel's Avatar
 
Posts: 119
Karma: 10
Join Date: May 2010
Location: NRW, Germany
Device: Pocketbook 360° + Kindle 3
Vielen Dank @K-Thom & @Manichean für eure (erneute) Hilfe!

Quote:
Originally Posted by K-Thom View Post
Die sicherste - aber aufwendigste - Methode ist und bleibt allerdings das manuelle Rauslöschen. Sonst kann es dir passieren, dass du solche Textstellen plötzlich automatisch mitlöscht.
kann ich das denn auch mit Calibre? Ich kann mir ja den Text in dem Fenster (wo ich zB die Fußzeilen entfernen können sollte..) auch ein Testfenster öffnen lassen.. kann ich dort dauerhaft die Seitenzahlen löschen oder muss ich wirklich den kompletten Text aus dem PDF kopieren (womit alle Formatierung flöten geht..) und dann die Seitenzahlen noch Manuell rauslöschen?

Da ich meinem Buch viele (wichtige) Jahreszahlen vorkommen, ist vielleicht wirklich der manuelle Weg der Beste..
Zel is offline   Reply With Quote
Old 09-23-2010, 11:50 AM   #15
Manichean
Wizard
Manichean My eyes! My eyes! The light is just too bright!Manichean My eyes! My eyes! The light is just too bright!Manichean My eyes! My eyes! The light is just too bright!Manichean My eyes! My eyes! The light is just too bright!Manichean My eyes! My eyes! The light is just too bright!Manichean My eyes! My eyes! The light is just too bright!Manichean My eyes! My eyes! The light is just too bright!Manichean My eyes! My eyes! The light is just too bright!Manichean My eyes! My eyes! The light is just too bright!Manichean My eyes! My eyes! The light is just too bright!Manichean My eyes! My eyes! The light is just too bright!
 
Manichean's Avatar
 
Posts: 3,130
Karma: 80446
Join Date: Feb 2008
Location: Germany
Device: Cybook Gen3
Quote:
Originally Posted by Zel View Post
kann ich das denn auch mit Calibre? Ich kann mir ja den Text in dem Fenster (wo ich zB die Fußzeilen entfernen können sollte..) auch ein Testfenster öffnen lassen.. kann ich dort dauerhaft die Seitenzahlen löschen oder muss ich wirklich den kompletten Text aus dem PDF kopieren (womit alle Formatierung flöten geht..) und dann die Seitenzahlen noch Manuell rauslöschen?
Nein. Aber Du kannst über den Tab "Fehlersuche" in den Konvertierungseinstellungen die HTML- Zwischenstufe der Konvertierung abgreifen, diese bearbeiten und als neues Format dem Buch wieder hinzufügen. Dann mußt Du vom HTML konvertieren und alles sollte gut sein.
Quote:
Originally Posted by Zel View Post
Da ich meinem Buch viele (wichtige) Jahreszahlen vorkommen, ist vielleicht wirklich der manuelle Weg der Beste..
Eigentlich sollte ein vernünftiger regulärer Ausdruck zwischen Seitenzahlen und Jahreszahlen anhand der umgebenden Tags differenzieren können. Kannst Du einen Abschnitt aus dem Buch posten, der eine Jahres- und eine Seitenzahl, oder geht das wegen Copyright oder so nicht? (Sonst per PM.) Dann könnte man da nämlich mehr zu sagen als diese Konjunktiv- Formulierung da oben
Manichean is offline   Reply With Quote
Reply

Thread Tools Search this Thread
Search this Thread:

Advanced Search

Forum Jump

Similar Threads
Thread Thread Starter Forum Replies Last Post
von .doc zu .epub über Calibre? laura86 Software 3 06-29-2010 06:22 AM
Epub/Mobi TO pdf conversion problem Hitch Calibre 4 06-15-2010 05:28 PM
Entfernen von DRM bei Kindle eBooks klappt! K-Thom Amazon Kindle 3 01-14-2010 12:00 PM
Calibre: Header entfernen nicht mit aktueller Version ?? KimJ Software 5 01-06-2010 12:39 AM
PDF -> LRF, ePUB, MOBI? krischik Calibre 12 07-23-2009 11:37 PM


All times are GMT -4. The time now is 04:09 AM.


MobileRead.com is a privately owned, operated and funded community.