09-17-2010, 02:41 PM | #1 |
Member
Posts: 23
Karma: 10
Join Date: Sep 2010
Device: galaxy
|
Zeilenumbrüche entfernen
Hallo,
ich habe mehrere PDFs in Text Dateien umgewandelt. Nun möchte ich aus diesen textdateien zumindest die überflüssigen Zeilenumbrüche entfernen. Wie mache ich das am besten? Ich frage da es anscheinend Unterschiede gibt wie Zeilen gefunden werden. Z.b. arbeitet sed Zeilenbabasiert? Zumindest laut diverser Internet Seiten. Damit kann ich also kein \r\n entfernen? Die geht das am besten? grüße Gucky |
09-18-2010, 06:19 PM | #2 |
Addict
Posts: 248
Karma: 100148
Join Date: Jul 2010
Location: Germany, Munich
Device: Kindle 3 & DX Graphite, PocketBook 302 & Pro 603
|
Wenn's HTML ist, versuch's mal mit Notepad++
http://notepad-plus-plus.org/de/node/56 |
Advert | |
|
09-19-2010, 08:16 AM | #3 |
Connoisseur
Posts: 68
Karma: 10
Join Date: Sep 2008
Device: keines
|
auf dieser seite findest du einige erweiterungen bzw. makros für openoffice.
http://luke.simplicissimus.it/ |
09-20-2010, 01:01 PM | #4 |
Fidibus
Posts: 440
Karma: 2246533
Join Date: Feb 2010
Device: none
|
Mit Open Office geht das auch ganz ohne Makros oder Erweiterungen. Einfach mit Suche und Ersetze und Regulären Ausdrücken.
Suche "$", ersetze mit nichts -> alle weg. Wirklich alle. Suche "^$", ersetze mit nichts -> Leerzeilen weg. |
09-20-2010, 04:19 PM | #5 |
The one and only
Posts: 3,302
Karma: 535819
Join Date: Oct 2008
Location: Berlin, Germany
Device: yup!
|
Es geht hier aber nicht um Leerzeilen, sondern um harte Zeilenumbrüche, wenn ich das richtig verstanden habe.
@ gucky: mit welchem Programm arbeitest du denn? |
Advert | |
|
09-21-2010, 03:03 AM | #6 |
Fidibus
Posts: 440
Karma: 2246533
Join Date: Feb 2010
Device: none
|
Das kommt davon, wenn man sich nicht genug Zeit nimmt zum schreiben. Sorry.
"$" ist der "Reguläre Ausdruck" für Zeilenumbruch. "^" steht für Zeilenanfang. "^$" wäre ein Beispiel für die Kombination zweier regulärer Ausdrücke, um die Sache weiter einzugrenzen. So weit ich weiß, kann das die Suche und Ersetze Funktion in Word nicht so differenziert. Hat der Text z.B. nach jedem Absatz eine Leerzeile, kann man diese durch irgendeine Zeichenkombination ersetzen, die im normalen Text nicht vorkommt. z.B. xxx Dann entfernt man alle Zeilenumbrüche, oder ersetzt in einem Zwischenschritt durch ein Leerzeichen und ersetzt dann alle Umbrüche. Um die Umbrüche am Absatzende wieder zu erhalten, ersetzt man xxx durch einen Zeilenumbruch "\n". Mehr Info: http://www.ooowiki.de/Regul%C3%A4rerAusdruck |
Thread Tools | Search this Thread |
|
Similar Threads | ||||
Thread | Thread Starter | Forum | Replies | Last Post |
Calibre: Seitenzahlen von pdf in epub/mobi entfernen | Zel | Software | 30 | 11-20-2019 09:44 AM |
Entfernen von DRM bei Kindle eBooks klappt! | K-Thom | Amazon Kindle | 3 | 01-14-2010 12:00 PM |
Calibre: Header entfernen nicht mit aktueller Version ?? | KimJ | Software | 5 | 01-06-2010 12:39 AM |
Deutsche Software entfernen | Vauh | Sony Reader | 9 | 12-22-2009 12:02 PM |