Datensatz

Deutsche Wortliste mit Wortarten

Das Angebot wurde vom Verkäufer am 3. März 2014 vor 2.665 days erstellt.
Was enthält der Datensatz?
Dieser Datensatz enthält die häufigsten 840.000 Wörter der deutschen Sprache. Die Liste ist ansteigend nach Häufigkeit geordnet.


Welche Datenfelder sind vorhanden?

Die Datenfelder enthalten den Rangplatz, das Wort selbst, die absolute und relative Häufigkeit sowie die Wortart (also Nomen, Artikel, Adjektiv, Adverb etc.) Wobei ein Wort je nach Bedeutung im Satz auch mehrere Wortarten zugeordnet haben kann. So kann man sich z.B. nur alle deutschen Substantive/Nomen oder Adjektive filtern und eine getrennte Liste erzeugen. 
Hinweis: Nicht bei jedem Wort ist die Wortart vermerkt, aber bei mehr als 80% der Einträge.

In welchem Datenformat wird geliefert?
Das Datenformat ist SQL und CSV.

Welche Verwendungen sind möglich?Wortartbestimmung, Häufigkeitsanalyse, Namenerkennung, Stoppwortgenerierung, Rechtschreibprüfung, Tagging etc.
Bitte auf das Bild klicken um zu vergrößern.

Bild 1 top30.png
Bild 2 nomen.png
    Noch keine Kommentare zu diesem Datensatz vorhanden.

Neuer Kommentar

Sie benötigen Hilfe??

Detailfragen zum Datensatz beantworten wir gerne per E-Mail. Senden Sie uns einfach eine Nachricht, wir helfen gerne, um den perfekten Datensatz für Ihre Bedürfnisse zu finden.

support

Liste aller Dateien

worte_pos.sql.zip
Size: 10.64M
sql
worte_pos.csv.zip
Size: 10.52M
csv

Bildrechte: Bild Englische Wortliste Autor: Dr. Marcus Gossler Lizenz: CC-BY-SA-3.0 . Alle Bilder zugeschnitten und farbtonangepasst.