Textverarbeitung mit Python
Python Praxis 8
In dieser Übung wird weiter mit Dateien gearbeitet.
Übung 1: Nehmen Sie das Programm aus der letzten
Übung (7.3). Zur Erinnerung, die Aufgabe 7.3 war:
Schreiben Sie ein Programm, das eine Datei öffnet (z.B. hexe.txt),
die eine Datei einliest und zählt, wie oft ein bestimmtes Wort in der Datei vorkommt (z.B. "Hexe").
Verwalten Sie die Resultate in einem Dictionary. Der key ist das Wort selber,
der value wie oft das Wort vorkam. Informieren Sie den User am Ende, welche Worte wie oft auftraten.
Modifizieren Sie das Programm nun wie folgt:
- Statt die im Dictionary gespeicherten Resultate auf dem Terminal
auzugeben, sollten die Resultate in eine Datei geschrieben werden
und dem User sollte gesagt werden, wo die Resultate denn nun
abgelegt sind (d.h., in welcher Datei sie abgespeichert wurden).
- Geben Sie nun noch die häufigsten 10 Worte aus, die im Text
vorkommen.
- Modifizieren Sie das Programm, so dass es Satzzeichen und
häufige Funktionswörter (z.B. the, a, an, and, or, is,
are ) nicht mitzählt. D.h.,
integrieren Sie eine sogenannte STOPLIST in Ihr Programm. Was sind
nun die 10 häufigsten Wörter?
- Modifizieren Sie das Programm weiter, so dass es zusätzlich
auch noch das längste Wort der Datei ermittelt und als Output
ausgibt.
- Ermitteln Sie alle Worte, in denen "mal" vorkommt (oder eine
andere sinnvolle Zeichenkette) und geben Sie
diese als Output aus. Geben Sie auch aus, wieviele "mal" Worte
insgesamt in dem Text waren.
- Modifizieren Sie das Programm weiter, so dass es ein
bestimmtes Wort (z.B. "Hexe") gegen ein anderes Wort Ihrer Wahl
austauscht (hier ist string.replace gefragt) und dann die so
veränderte Datei Zeile um Zeile ausdruckt.
- Modifizieren Sie das Programm nun noch so, dass alle Resultate in
einer Datei gespeichert werden und dem User gesagt wird, wie die
Datei mit den gespeicherten Resultaten heisst.
Ende