Was macht datenbörse.net?
Wir sind führender Handelsplatz für geschäftliche Adressen. Für jede Zielgruppe kaufen Sie auf unserer Webseite geprüfte Branchenadressen als Datei zum Download. Erwerben Sie hier preiswerte Kontakte zu Interessenten für ihre Produkte zum Direktmarketing.
Angebot Datensatz

Korpus - Deutsche Nachrichtenmeldungen

Das Angebot wurde von einem Nutzer am 24. Juli 2019 inseriert.
Die Datenbank enthält 10.494 Nachrichtenmeldungen aus verschiedenen Rubriken über die Jahre 2007 bis 2011. Zur einfachen Weiterverarbeitung sind die Dateiformate TXT und SQL angehängt. Das Dateiencoding ist UFT8. Die Datenfelder enthalten neben dem Nachrichtentext, auch die Überschrift, das Datum und die Quelle. Es handelt sich damit um einen diachronen Textkorpus der sich hervorragend zur historischen Trendanalyse, Korpusstatistik und automatischen Sprachanalyse (Neologismen etc.) eignet.

Die Datenbank wurde automatisch aus dem deutschen Wikinews Projekt extrahiert und steht somit unter der selben Lizenz.

Quelle: http://dumps.wikimedia.org/dewikinews/latest/

Lizenz: CC-BY-SA

Auszug aus der Datenbank:


Thunderbird 1.0 freigegeben


Paris (Frankreich), 07.12.2004 - Seit dem 7. Dezember ist der E-Mail-Client, News- und RSS-Reader Mozilla Thunderbird 1.0 für Windows, Linux, Solaris und MacOS verfügbar. Thunderbird wurde Mitte 2003 aus der Mozilla Websuite ausgegliedert und als eigenständiges Projekt weiterentwickelt, nachdem die Websuite als zu langsam und zu groß in die Kritik geraten war. Damit ist nun neben dem eigenständigen Browser Mozilla Firefox, der am 9. November 2004 die Version 1.0 erreicht hatte, auch der E-Mail-Client des Mozillaprojekts der Betaphase entwachsen. Die unter dem Namen Mozilla Sunbird entwickelte Kalenderapplikation ist aber noch in einem sehr frühen Entwicklungsstadium.
Bei der Entwicklung des Open-Source-Programms wurde viel Wert auf Sicherheit, Schnelligkeit und einfache Bedienung gelegt. Der E-Mail-Client kann einfach mittels Erweiterungen, auch „Extensions“ genannt, um neue Funktionen erweitert werden. Möglich ist der Import von Nachrichten, Adressen und sogar Einstellungen aus Outlook, Outlook Express und ähnlichen Programmen.
Funktionen des Mailprogramms sind unter anderem ein Spamfilter, automatische Rechtschreibprüfung und eine Profilverwaltung für mehrere Nutzer. Das Verschlüsseln und Signieren von Nachrichten mit S/MIME wird von Haus aus unterstützt, für GnuPG/PGP-Funktionalität wird die Erweiterung „Enigmail“ benötigt – speziell letzteres ist eine Funktion, die für einen größeren Nutzerkreis zum Schutz ihrer Privatsphäre interessant werden könnte, wenn am 1. Januar 2005 die TKÜV (Telekommunikations-Überwachungsverordnung) in Kraft tritt.
Seit der Version 0.8 wird auch ein zentraler Posteingang unterstützt. In der Version 0.9 waren die so genannten Virtuellen Ordner das Highlight der Entwicklung. Mit diesen Virtuellen Ordnern lassen sich Suchvorgänge als Ordner abspeichern, die dann automatisch alle E-Mails enthalten, auf die die Suchkriterien zutreffen.
Für die Version 1.0 haben die Entwickler vor allem an der Importfunktionalität gearbeitet, auch der RSS-Reader wurde verbessert. Mailfilter, die bisher nur für POP3-Accounts verfügbar waren, funktionieren nun auch über IMAP. Das Adressbuch kann nun mit einer Schnellsuchleiste durchblättert werden und schließlich wurde das Gruppieren von Nachrichten verbessert.




Was ist ein Nachrichtenkorpus ?
Ein Nachrichtenkorpus (auch: Textkorpus) ist eine Sammlung von Texten, die dazu verwendet werden, natürliche Sprache zu analysieren. Diese Textsammlungen umfassen in der Regel Zeitungsartikel, Blogs, Bücher, Webseiten und andere Quellen, die in elektronischer Form gespeichert sind. Das Korpus kann als eine Datenbank verwendet werden, um bestimmte Arten von Texten zu finden, die für bestimmte Zwecke herangezogen werden können. Es wird häufig verwendet, um bestimmte Themen oder Trends in der Sprache zu analysieren, und es kann auch verwendet werden, um die Verwendung bestimmter Wörter oder bestimmter grammatikalischer Strukturen in einer Sprache zu untersuchen.
Bitte auf das Bild klicken um zu vergrößern.

Bild 1 Meldung.png
    Noch keine Kommentare zu diesem Datensatz vorhanden.

Neuer Kommentar

Sie benötigen Hilfe??

Detailfragen zum Datensatz beantworten wir gerne per E-Mail. Senden Sie uns einfach eine Nachricht, wir helfen gerne, um den perfekten Datensatz für Ihre Bedürfnisse zu finden.

support

Download der Dateien

wikinews_de.csv
Größe: 17.34M
csv
wikinews_de.sql
Größe: 17.44M
sql
korpus.txt.zip
Größe: 10.19M
txt


Bildrechte auf dieser Webseite:

Bild Liste deutscher Zeitungen Autor: Fridolin freudenfett Lizenz: CC-BY-SA-4.0 / Bild Hundenamen Autor: Jazz-face Lizenz: CC-BY-SA-2.5 / Bild Englische Wortliste Autor: Dr. Marcus Gossler Lizenz: CC-BY-SA-3.0 . Alle Bilder zugeschnitten und farbtonangepasst.