Textverarbeitung mit Perl

Nutzung des TreeTaggers

Um den TreeTagger im MacRaum nutzen zu können, muss im Terminal zunächst in das Verzeichnis gewechselt werden, in dem er installiert ist:

cd /Users/cluser/bin/TreeTagger/

An diese Stelle sollte auch eine Textdatei zum Testen (z.B. test.txt) gespeichert werden. Danach kann diese Textdatei lemmatisiert und mit POS-Tags versehen werden, indem folgender Befehl im Terminal eingegeben wird:

cmd/tree-tagger-german test.txt

Wenn die Resultate in eine Datei geschrieben werden sollen, muss diese am Ende nach einer spitzen Klammer benannt werden:

cmd/tree-tagger-german test.txt > resultat.txt

Natürlich kann statt "-german" auch eine der anderen verfügbaren Sprachen gewählt werden.

Die genutzten Tags für das Deutsche sind hier erklärt: STTS Tag Table

Bei Fragen gerne an Anja Leiderer wenden.

Ende