1

我已经为一个读取 txt 文件并返回关键词的作业创建了一个程序。我的程序返回关键词,但其中一个词“数据”存在一个问题。我应该只得到 6 个结果,但我得到 7 个。我认为原因是文本“数据 - 分析”中存在一个复合词。该程序似乎正在挑选它并将其计入最终结果。有什么我可以在我的代码末尾插入的东西来消除这个吗?

import string
text = open('news1.txt').read()+open ('news2.txt').read()
print 'data:', string.count(text, 'data')
4

1 回答 1

0

如果没有看到您的实际输入文件,很难确定,但有一种明显的可能性:

新闻1.txt:

data data data dat

新闻2.txt

a data data data

文件中只有 6 个“数据”一词的实例。但是如果你连接文件,你会得到这个:

data data data data data data data

……你会数 7 而不是 6。

你的老师给你的文件看起来像这样是为了准确地捕捉到这种错误,这是完全合理的。在野外不经常出现的边缘案例,并且你没有想过要测试,正是那些让你沮丧数月的事情——试图从用户那里拖出重现信息,调试程序等等。这是在你的编程生涯早期学习的好课。

于 2013-11-08T19:05:24.523 回答