所以我有一个文本文件,其中包含罗密欧与朱丽叶戏剧第一幕的剧本,我想计算某人说了多少次单词。
这是文本: http: //pastebin.com/X0gaxAPK
文中有 3 个人在讲话:Gregory、Sampson 和 Abraham。
基本上我想为三个演讲者中的每一个制作 3 个不同的词典(如果这是最好的方法吗?)。用人们分别说的单词填充字典,然后计算他们在整个脚本中说出每个单词的次数。
我该怎么做呢?我想我可以算出字数,但是对于如何区分谁说什么并将其放入每个人的 3 个不同的字典中,我有点困惑。
我的输出应该是这样的(这是不正确的,但一个例子):
Gregory -
25: the
15: a
5: from
3: while
1: hello
etc
其中数字是文件中所说的单词的频率。
现在,我编写了读取文本文件、去除标点符号并将文本编译成列表的代码。我也不想使用任何外部模块,我想用老式的方式来学习,谢谢。
您不必发布确切的代码,只需解释我需要做什么,希望我能弄清楚。我正在使用 Python 3。