| 
			
			 | 
		#16 | 
| 
			
			
			
			 BioReader 
			
			![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Posts: 292 
				Karma: 42568 
				Join Date: Apr 2009 
				Location: Germany 
				
				
				Device: Various 
				
				
				 | 
	
	
	
		
		
		
		
		 
			
			Manchmal ist es besser die Kopf- oder Fußzeile bereits im pdf zu entfernen. Es gibt da ein kleines Java Snippet BRISS (Suchfunktion hier im Forum), welches ein pdf "schneidet" (Crop). Funktioniert, wenn die Position der Kopf- bzw- Fußzeile im pdf immer gleich ist. Mal ausprobieren.
		 
		
	
		
		
		
		
		
		
		
		
		
		
	
	 | 
| 
		 | 
	
	
	
		
		
		
		
			 
		
		
		
		
		
		
		
			
		
		
		
	 | 
| 
			
			 | 
		#17 | |
| 
			
			
			
			 Wizard 
			
			![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Posts: 3,130 
				Karma: 91256 
				Join Date: Feb 2008 
				Location: Germany 
				
				
				Device: Cybook Gen3 
				
				
				 | 
	
	
	
		
		
		
		
		 Quote: 
	
  | 
|
| 
		 | 
	
	
	
		
		
		
		
			 
		
		
		
		
		
		
		
			
		
		
		
	 | 
| 
			
			 | 
		#18 | 
| 
			
			
			
			 BioReader 
			
			![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Posts: 292 
				Karma: 42568 
				Join Date: Apr 2009 
				Location: Germany 
				
				
				Device: Various 
				
				
				 | 
	
	
	
		
		
		
		
		 
			
			... bei variierenden Kopf- und Fußzeilen ist das einfacher (jedenfalls für mich) als ständig eine Regex anzupassen. Bei "Zubehör" mitten im Text sieht das natürlich anders aus. Ich verwende das Cropping häufig bei gescantem Material.
		 
		
	
		
		
		
		
		
		
		
		
		
		
	
	 | 
| 
		 | 
	
	
	
		
		
		
		
			 
		
		
		
		
		
		
		
			
		
		
		
	 | 
| 
			
			 | 
		#19 | |
| 
			
			
			
			 Wizard 
			
			![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Posts: 3,130 
				Karma: 91256 
				Join Date: Feb 2008 
				Location: Germany 
				
				
				Device: Cybook Gen3 
				
				
				 | 
	
	
	
		
		
		
		
		 Quote: 
	
  
		 | 
|
| 
		 | 
	
	
	
		
		
		
		
			 
		
		
		
		
		
		
		
			
		
		
		
	 | 
| 
			
			 | 
		#20 | 
| 
			
			
			
			 Zealot 
			
			![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Posts: 135 
				Karma: 1052388 
				Join Date: Oct 2010 
				Location: Germany, Potsdam 
				
				
				Device: Pocketbook Touch HD 3, Sony PRS 650 
				
				
				 | 
	
	
	
		
		
		
		
		 
			
			Das PDF bei mir gibt bei den Seitenanzahl es immer folgt an, z.b. für Seite eins "-1-". Was wäre da am besten?
		 
		
	
		
		
		
		
		
		
		
		
		
		
	
	 | 
| 
		 | 
	
	
	
		
		
		
		
			 
		
		
		
		
		
		
		
			
		
		
		
	 | 
| 
			
			 | 
		#21 | |
| 
			
			
			
			 Wizard 
			
			![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Posts: 3,130 
				Karma: 91256 
				Join Date: Feb 2008 
				Location: Germany 
				
				
				Device: Cybook Gen3 
				
				
				 | 
	
	
	
		
		
		
		
		 Quote: 
	
 1. Interessant ist die Art, wie dies in der HTML- Zwischenstufe realisiert wird. In der Strukturerkennung bei den Konvertierungseinstellungen, klicke auf den Zauberstab bei Kopf-/Fußzeilenentfernung und suche in dem Code, der dann angezeigt wird, eine Seitenzahl. 2. Zur Entfernung siehe hier.  | 
|
| 
		 | 
	
	
	
		
		
		
		
			 
		
		
		
		
		
		
		
			
		
		
		
	 | 
| 
			
			 | 
		#22 | |
| 
			
			
			
			 Junior Member 
			
			![]() Posts: 1 
				Karma: 10 
				Join Date: Oct 2010 
				
				
				
				Device: Sony PRS 505 für Bücher IPad für Magazine 
				
				
				 | 
	
	
	
		
		
		
		
		 Quote: 
	
 Nun das kommt darauf an wie es genau in Deiner pdf-Datei aussieht. Du findest das in der Vorschau wenn Du den regulären Ausdruck erstellst. Nehmen wir mal an wir haben soetwas: text <br> -28- <br> <hr> <A name=29></a> text dann würde der reguläre Ausdruck so aussehen: <br>\s-\d{1,4}-\s<br>\s<hr>\s<A name=\d{1,4}></a> setzt sich dabei wie folgt zusammen \s kennzeinet ein Leerzeichen oder Zeilenumbruch \d bezeichnet beliebige Dezimalzahl \d{1,4} bezeichnet eine Zahl die bis zu vier Stellen haben kann bjarneee Last edited by bjarneee; 10-23-2010 at 05:50 AM.  | 
|
| 
		 | 
	
	
	
		
		
		
		
			 
		
		
		
		
		
		
		
			
		
		
		
	 | 
| 
			
			 | 
		#23 | 
| 
			
			
			
			 Zealot 
			
			![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Posts: 135 
				Karma: 1052388 
				Join Date: Oct 2010 
				Location: Germany, Potsdam 
				
				
				Device: Pocketbook Touch HD 3, Sony PRS 650 
				
				
				 | 
	
	
	
		
		
		
		
		 
			
			OK, vielen Dank, werde ich bei Gelegenheit probieren.
		 
		
	
		
		
		
		
		
		
		
		
		
		
	
	 | 
| 
		 | 
	
	
	
		
		
		
		
			 
		
		
		
		
		
		
		
			
		
		
		
	 | 
| 
			
			 | 
		#24 | 
| 
			
			
			
			 Member 
			
			![]() Posts: 20 
				Karma: 10 
				Join Date: Dec 2010 
				
				
				
				Device: IQ & Omnia II 
				
				
				 | 
	
	
	
		
		
		
		
		 
			
			Wenn in der Vorschau die Seitenzahl mit ... 28<br> ... angegeben ist 
		
	
		
		
		
		
		
		
		
		
		
		
	
	sollte der reguläre Ausdruck so aussehen: ([0-9]+[0-99]<br>) Es funktioniert für die Seitenzahlen von 10 bis ... Leider hab ich noch nicht heraus gefunden wie ich die Seitenzahlen bis 10 weg bekomme. Aber die paar Seitenzahlen kann man auch in der PDF entfernen. Vielleicht hat ja jemand eine Idee wie man über die Regex auch die anderen weg bekommt  
		 | 
| 
		 | 
	
	
	
		
		
		
		
			 
		
		
		
		
		
		
		
			
		
		
		
	 | 
| 
			
			 | 
		#25 | |
| 
			
			
			
			 Wizard 
			
			![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Posts: 3,130 
				Karma: 91256 
				Join Date: Feb 2008 
				Location: Germany 
				
				
				Device: Cybook Gen3 
				
				
				 | 
	
	
	
		
		
		
		
		 Quote: 
	
 Code: 
	[0-9]+<br>  | 
|
| 
		 | 
	
	
	
		
		
		
		
			 
		
		
		
		
		
		
		
			
		
		
		
	 | 
| 
			
			 | 
		#26 | 
| 
			
			
			
			 Member 
			
			![]() Posts: 20 
				Karma: 10 
				Join Date: Dec 2010 
				
				
				
				Device: IQ & Omnia II 
				
				
				 | 
	
	
	
		
		
		
		
		 
			
			Hey, danke Manichean!!! Es funktioniert wirklich super 
		
	
		
		
		
		
		
		
		
		
		
		
	
	Hab mir gleich gedacht das es auch kürzer geht und ich was falsch mache. Kenne mich mit Calibre noch nicht so gut aus und bin wohl eher durch Zufall darauf gekommen. Nochmals  
		 | 
| 
		 | 
	
	
	
		
		
		
		
			 
		
		
		
		
		
		
		
			
		
		
		
	 | 
| 
			
			 | 
		#27 | 
| 
			
			
			
			 Wizard 
			
			![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Posts: 3,130 
				Karma: 91256 
				Join Date: Feb 2008 
				Location: Germany 
				
				
				Device: Cybook Gen3 
				
				
				 | 
	
	
	
		
		
		
		
		 
			
			Das ist eher ein prinzipieller Fehler im regulären Ausdruck. Guck Dir nochmal genau an, was ich schrieb.
		 
		
	
		
		
		
		
		
		
		
		
		
		
	
	 | 
| 
		 | 
	
	
	
		
		
		
		
			 
		
		
		
		
		
		
		
			
		
		
		
	 | 
| 
			
			 | 
		#28 | 
| 
			
			
			
			 Junior Member 
			
			![]() Posts: 2 
				Karma: 10 
				Join Date: Oct 2019 
				
				
				
				Device: Kobo 
				
				
				 | 
	
	
	
		
		
		
		
		 
			
			Hallo liebes Forum, 
		
	
		
		
		
		
		
		
		
		
		
		
	
	ich versuche gerade eine .pdf in .epub umzuwandeln und habe dabei das in diesem Thread diskutierte Problem mit den Seitenzahlen. Obendrein folgt auf die Seitenzahl auch stets der jeweilige Kapitelname. Das muss alles weg! Der "Quellcode" sieht beispielsweise folgendermaßen aus: Text</p> <p class="calibre1"><a id="p10"></a>Einleitung</p> <p class="calibre1">9</p> <p class="calibre1">Text Text</p> <p class="calibre1"><a id="p28"></a>Quintessenz und Ausblick</p> <p class="calibre1">27</p> <p class="calibre1">Text Nach anderthalb Stunden erfolglosem Herumsprobierens mit der Regex-Syntax bin ich mit den Nerven am Ende. Kann mir hier jemand helfen und die passende Befehlszeile nennen? Ich möchte endlich   Vielen Dank  
		 | 
| 
		 | 
	
	
	
		
		
		
		
			 
		
		
		
		
		
		
		
			
		
		
		
	 | 
| 
			
			 | 
		#29 | |
| 
			
			
			
			 Grand Sorcerer 
			
			![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Posts: 5,763 
				Karma: 24088559 
				Join Date: Dec 2010 
				
				
				
				Device: Kindle PW2 
				
				
				 | 
	
	
	
		
		
		
		
		 Quote: 
	
 Code: 
	</p> <p class="calibre1"><a id="p10"></a>Einleitung</p> <p class="calibre1">9</p> Das müsste mit dem folgenden regulären Ausdruck klappen: Code: 
	</p>\s+<p class="calibre\d+"><a id="p\d+"></a>.*?</p>\s+<p class="calibre\d+">\d+</p>\s+<p class="calibre\d+"> Code: 
	</p>\s+<p class="calibre1"><a id="p\d+"></a>.*?</p>\s+<p class="calibre1">\d+</p>\s+<p class="calibre1">  | 
|
| 
		 | 
	
	
	
		
		
		
		
			 
		
		
		
		
		
		
		
			
		
		
		
	 | 
| 
			
			 | 
		#30 | 
| 
			
			
			
			 Junior Member 
			
			![]() Posts: 2 
				Karma: 10 
				Join Date: Oct 2019 
				
				
				
				Device: Kobo 
				
				
				 | 
	
	
	
		
		
		
		
		 
			
			Vielen Dank für deine Antwort! 
		
	
		
		
		
		
		
		
		
		
		
		
	
	Der von dir gepostete Ausdruck hat zwar null Treffer ergeben (irgendwo im hinteren Drittel scheint was nicht zu stimmen) aber er hat mir das nötige Rüstzeug (Struktur und Befehle) gegeben um das letzte Drittel selber neu zu schreiben. Jetzt funktioniert's und ich kann endlich loslegen  
		 | 
| 
		 | 
	
	
	
		
		
		
		
			 
		
		
		
		
		
		
		
			
		
		
		
	 | 
![]()  | 
            
        
            
            
  | 
    
			 
			Similar Threads
		 | 
	||||
| Thread | Thread Starter | Forum | Replies | Last Post | 
| von .doc zu .epub über Calibre? | laura86 | Software | 3 | 06-29-2010 07:22 AM | 
| Epub/Mobi TO pdf conversion problem | Hitch | Calibre | 4 | 06-15-2010 06:28 PM | 
| Entfernen von DRM bei Kindle eBooks klappt! | K-Thom | Amazon Kindle | 3 | 01-14-2010 01:00 PM | 
| Calibre: Header entfernen nicht mit aktueller Version ?? | KimJ | Software | 5 | 01-06-2010 01:39 AM | 
| PDF -> LRF, ePUB, MOBI? | krischik | Calibre | 12 | 07-24-2009 12:37 AM |