我正在尝试识别一个特定的单词,然后计算它。我需要保存每个标识符的计数。
例如,
风险风险无风险利率
星号风险风险
市场风险风险[风险
*一份文件包含上面的文字,我需要计算“风险”而不是星号。我还需要将 [风险视为“风险”。这是我到目前为止所拥有的。但是,它返回星号和 [风险以及风险的计数。我不需要计算星号,只需要计算风险,包括 [risk. 我尝试使用正则表达式,但不断出错。另外,我是 Python 的初学者。如果有人有任何想法,请帮助我!^^谢谢。
from collections import defaultdict
word_dict = defaultdict(int)
for line in mylist:
words = line.lower().split()
for word in words:
word_dict[word]+=1
for word in word_dict:
if 'risk' in word:
word, word_dict[word]