View Single Post
Old 12-05-2012, 02:38 PM   #10
SIRSteiner
Nameless Being
 
Quote:
Originally Posted by Kyriako View Post
Hallo SIRSteiner,
es hat geklappt! Das Ergebnis sieht gut aus. Vielen Dank.
Vielen Bitte!
Quote:
An anderer Stelle hatte ich Dich folgendes gefragt:
von morphems.txt habe ich mittlerweile zwei Versionen: eine kurze mit 42 Bytes, eine lange mit 75.673 Bytes.
Was hat es damit auf sich?
Diese Datei soll dafür sorgen, dass gebeugte Verben oder deklinierte Substantive gefunden werden. Dabei werden zunächst über die Zeilen beginnend mit "%" und einer fortlaufenden Nummer die Buchstabenklassen definiert. Im Deutschen sind das im wesentlichen Vokale und Konsonanten.
Die Zeilen beginnend mit "^" dienen dann zur Umwandlung der Wortformen in die Grundformen. Dabei entsprechen auf der linken Seite des "=" die Zahlen den Buchstaben der jeweiligen Klasse. Ein Fragezeichen steht für einen beliebigen Buchstaben. Wenn ein Suchwort dieser "Maske" entspricht, erfolgt eine Ersetzung entsprechend der rechten Seite und danach wird dann im Wörterbuch gesucht. Ein Punkt aus der rechten Seite steht dabei für den "Stamm".

Beispiel aus dem Englischen:

^?ly=.

Das Wort "normally" würde hier auf den Kern "normal" reduziert und danach im Wörterbuch gesucht.

Dies ist eine komplexe Angelegenheit und in meiner Converter-Version komplett inaktiv, da ich keine sinnvolle morphems.txt gefunden habe.
Poste doch mal Deine größte morphems.txt.
Quote:
Noch eine Frage:
mein PB 903 hat ein FR-EN-Wörterbuch, noch dazu ziemlich mittelmässig.
Gibt es irgendwo was für FR-DE und DE-FR?
Analog könnte man auch hier die dict.cc Vokabellisten verwenden. Musst nur das Script anpassen.

Gruß
Ronny
  Reply With Quote