Textverarbeitung mit Python
Python Praxis 11
In dieser Übung arbeiten wir mit getaggten Dateien.
Übung: Schreiben Sie ein Programm, dass einen Text
nimmt (entweder aus der NLTK oder woanders her) und diesen wie folgt
bearbeitet:
- Suchen Sie sich einen Text aus (NLTK, Gutenberg, Web, sonstige
Quelle).
- Lassen Sie einen POS-Tagger drüberlaufen. Entweder den aus
der NLTK oder den TreeTagger (im MacRaum installiert, Instruktionen
auf Webseite) oder sonst einen.
- Bringen Sie die getaggten Daten in ein Format, mit dem Sie in
Python arbeiten können (z.B. ein Tuple oder eine Liste).
- Ermittlen Sie, wieviele und welche Nomen im Text vorkamen (oder
eine sonstige POS Klasse, die Sie besonders interessiert).
Ende