我已经为一个读取 txt 文件并返回关键词的作业创建了一个程序。我的程序返回关键词,但其中一个词“数据”存在一个问题。我应该只得到 6 个结果,但我得到 7 个。我认为原因是文本“数据 - 分析”中存在一个复合词。该程序似乎正在挑选它并将其计入最终结果。有什么我可以在我的代码末尾插入的东西来消除这个吗?
import string
text = open('news1.txt').read()+open ('news2.txt').read()
print 'data:', string.count(text, 'data')