Textverarbeitung mit Python

Python Praxis 8

In dieser Übung wird weiter mit Dateien gearbeitet.


Übung 1: Nehmen Sie das Programm aus der letzten Übung (7.3). Zur Erinnerung, die Aufgabe 7.3 war:

Schreiben Sie ein Programm, das eine Datei öffnet (z.B. hexe.txt), 
die eine Datei einliest und zählt, wie oft ein bestimmtes Wort in der Datei vorkommt (z.B. "Hexe").
Verwalten Sie die Resultate in einem Dictionary. Der key ist das Wort selber,
der value wie oft das Wort vorkam. Informieren Sie den User am Ende, welche Worte wie oft auftraten.

Modifizieren Sie das Programm nun wie folgt:

  1. Statt die im Dictionary gespeicherten Resultate auf dem Terminal auzugeben, sollten die Resultate in eine Datei geschrieben werden und dem User sollte gesagt werden, wo die Resultate denn nun abgelegt sind (d.h., in welcher Datei sie abgespeichert wurden).
  2. Geben Sie nun noch die häufigsten 10 Worte aus, die im Text vorkommen.
  3. Modifizieren Sie das Programm, so dass es Satzzeichen und häufige Funktionswörter (z.B. the, a, an, and, or, is, are ) nicht mitzählt. D.h., integrieren Sie eine sogenannte STOPLIST in Ihr Programm. Was sind nun die 10 häufigsten Wörter?
  4. Modifizieren Sie das Programm weiter, so dass es zusätzlich auch noch das längste Wort der Datei ermittelt und als Output ausgibt.
  5. Ermitteln Sie alle Worte, in denen "mal" vorkommt (oder eine andere sinnvolle Zeichenkette) und geben Sie diese als Output aus. Geben Sie auch aus, wieviele "mal" Worte insgesamt in dem Text waren.
  6. Modifizieren Sie das Programm weiter, so dass es ein bestimmtes Wort (z.B. "Hexe") gegen ein anderes Wort Ihrer Wahl austauscht (hier ist string.replace gefragt) und dann die so veränderte Datei Zeile um Zeile ausdruckt.
  7. Modifizieren Sie das Programm nun noch so, dass alle Resultate in einer Datei gespeichert werden und dem User gesagt wird, wie die Datei mit den gespeicherten Resultaten heisst.

Ende