Textverarbeitung mit Python

Python Praxis 11

In dieser Übung arbeiten wir mit getaggten Dateien.


Übung: Schreiben Sie ein Programm, dass einen Text nimmt (entweder aus der NLTK oder woanders her) und diesen wie folgt bearbeitet:

  1. Suchen Sie sich einen Text aus (NLTK, Gutenberg, Web, sonstige Quelle).
  2. Lassen Sie einen POS-Tagger drüberlaufen. Entweder den aus der NLTK oder den TreeTagger (im MacRaum installiert, Instruktionen auf Webseite) oder sonst einen.
  3. Bringen Sie die getaggten Daten in ein Format, mit dem Sie in Python arbeiten können (z.B. ein Tuple oder eine Liste).
  4. Ermittlen Sie, wieviele und welche Nomen im Text vorkamen (oder eine sonstige POS Klasse, die Sie besonders interessiert).

Ende