[comp.archives] [dnet.and.sub.general] Re: Liste deutscher Worte / Spellchecker

sk@krabat.marco.de (Stefan Kutsch) (05/15/91)

Archive-name: text/dictionary/german-dictionary/1991-05-14
Archive: ftp.informatik.tu-muenchen.de:/pub/doc/dict/germanl.Z [131.159.0.110]
Original-posting-by: sk@krabat.marco.de (Stefan Kutsch)
Original-subject: Re: Liste deutscher Worte / Spellchecker
Reposted-by: emv@msen.com (Edward Vielmetti, MSEN)


In article <bruells.674135129@faramir>, Peter.Bruells@arbi.informatik.uni-oldenburg.de (Peter Bruells) writes:
> 
> Hallo... 
> 
> Ich suche einen Spellchecker der folgende Kritierien erfuellt:
> 
>  - fristt deutsch
.........\\\\\braucht dringend einen schpellschecker
>  - laeuft auf Unix (moeglichst unter C) 
>  - verkraftet LaTeX -- Schreibweise, wenn moeglich sogar die des german.sty
>    also ae = "a , "s = ss ... werden erkannt 
> 
> Fuer Englisch gibt es da den 'ispell' der ja uach ganz gut funktioniert, aber
> bevor ich versuche den umzuschreiben, frag ich doch lieber nach.
> 
> Ausserdem braeuchte ich eine ascii-liste deutscher Woerter, um ggf. einen
> Spellchecker zu trainieren oder umzutrainieren. 
> 
> Man dankt
> 
> 
> pb
die ascii-liste gibt's auf

ftp.informatik.tu-muenchen.de 131.159.0.110

/public/doc/dict/germanl.Z

stefan

noch immer ohne news-motto:
wiener schnitzel, sei's paniert

ich mag auch nen spellchecker

-- comp.archives file verification
ftp.informatik.tu-muenchen.de
-rw-r--r--  1 Elmar    staff      137591 May 13 14:47 /pub/doc/dict/germanl.Z
found german-dictionary ok
ftp.informatik.tu-muenchen.de:/pub/doc/dict/germanl.Z

icking@gmdzi.gmd.de (Werner Icking) (05/17/91)

Archive-name: text/dictionary/german-wordlist/1991-05-15
Archive: faui43.informatik.uni-erlangen.de:/portal/doc/dict/german-wordlist.Z [131.188.1.43]
Original-posting-by: icking@gmdzi.gmd.de (Werner Icking)
Original-subject: Re: Liste deutscher Worte / Spellchecker
Reposted-by: emv@msen.com (Edward Vielmetti, MSEN)


Peter.Bruells@arbi.informatik.uni-oldenburg.de (Peter Bruells) writes:

>Ausserdem braeuchte ich eine ascii-liste deutscher Woerter, um ggf. einen
>Spellchecker zu trainieren oder umzutrainieren. 

Darauf kamen zwei Antworten (u.a. eine von mir) mit Hinweisen auf vorhandene
Woerterlisten:

sk@krabat.marco.de (Stefan Kutsch) writes:

>die ascii-liste gibt's auf

>ftp.informatik.tu-muenchen.de 131.159.0.110

>/public/doc/dict/germanl.Z

icking@gmdzi.gmd.de (Werner Icking) writes:

>Im Rahmen einer aehnlichen Diskussion in ...  bekam ich von
> From: squirrel@bart.cs.mcgill.ca (Alexander OKAPUU-VON VEH)
> Subject: Re:  German Spell-Checker
>einen Hinweis auf eine Woerterliste, die leider Umlaute nur als Uemlaeutoe
>enthaelt:

>   Du kannst Dir die Liste holen:

>   Sie ist bei faui43.informatik.uni-erlangen.de unter 
>   /portal/doc/dict   und heisst  german-wordlist.Z

>   Ungefaehr 760 K komprimiert, 2.1 MB sonst.  

Da die  Nachfrage so grosz ist, habe ich auf beide Listen mal meinen
NI-Spellchecker angesetzt (der KI-Spellchecker ist ja noch in Arbeit).
Eine allererste Sichtung brachte bereits folgendes zu Tage:

Die ***Muenchener*** Woerterliste kennt so nuetzliche Woerter wie
    ANBE ANLLO" ARGE PM2 PM3 PME PU

Und auch der "Aasgeier" fehlt nicht (wohl aber dem Aasgeier sein Genitiv).

Auch kennt es Umlaute (U"mla"uto") und Esszet:
 
 AdresSbit AdresSbusses AdresSgenerierung
 Adressberechnungen Adressbus Adresserweiterung Adressgenerator Adressoffsets
 Adressraum Adressraumerweiterung
 Anschlu"sS AnschlusS
 Anschlu"ss Anschluss       wobei es aber an der Rechtschreibung hapert.

Die teutschen Woerter "Padrta Paella Paintadditiv" finden sich direkt in Reihe.

Und auch so beliebte Woerter wie "zusammenaddiert" oder "aufaddiert" fehlen nicht.

Wenn es um Genauigkeit geht, findet man u.a.
 Genau Genaue Genauere Genauikeit


Die **Erlangener** Woerterliste kennt  AT ATP und viele weitere nuetzliche
Buchstabenkombinationen.

Bei "Aasgeiern Aasgeiers" fehlt der Nominativ ebenso wie den
"Abenddaemmerungen" der Singular. Aehnliches gilt fuer
"Bliebe Blinddaerme Blinddaermen Blinddarms Blinde" oder
"Daemmerstunde Daemmerungen".

So etwas braucht man zum "Buechermachen"

Auch hier half die Suche nach Genauigkeit: "Genannten Genaratoren Genau"

Und wenn man mal wirklich ganz genaue hinschaut, findet man
  genaueste genauesten genausowenig genaustem genausten genauster

Dem laeszt sich fast nichts mehr "zuaddieren"!

 Genau Genaue Genauere Genauikeit

So etwas ist als *Eingabe* fuer einen Spellchecker gut brauchbar.
-- 
Werner Icking          icking@gmdzi.gmd.de          (+49 2241) 14-2443
Gesellschaft fuer Mathematik und Datenverarbeitung mbH (GMD)
Schloss Birlinghoven, P.O.Box 1240, D-5205 Sankt Augustin 1, FRGermany
                                  "Der Dativ ist dem Genitiv sein Tod."

-- comp.archives file verification
faui43.informatik.uni-erlangen.de
-rw-r--r--  1 Wizard   Source     761528 Jan 31 10:12 /portal/doc/dict/german-wordlist.Z
found german-wordlist ok
faui43.informatik.uni-erlangen.de:/portal/doc/dict/german-wordlist.Z