这很奇怪。我正在尝试实现文本频率计算,并在 ipython 笔记本中使用 python 2.7 运行以下代码。三个版本的函数。
第一个版本,只需计算字符串列表中单词的实例并将其粘贴到字典中:
testList = ['I', 'am', 'a', 'list', 'of', 'strings']
def tf1(listOfStrs):
thedict = dict((x,listOfStrs.count(x)) for x in set(listOfStrs))
print thedict
# produces expected output:
> {'a': 1, 'I': 1, 'am': 1, 'list': 1, 'of': 1, 'strings': 1}
好的,这工作正常。通过将每次出现除以单词总数来实际获得频率的时间。应该产生 0.16... 等
def tf2(listOfStrs):
print len(listOfStrs)
thedict = dict((x,listOfStrs.count(x)/len(listOfStrs)) for x in set(listOfStrs))
print thedict
tf2(testList)
> 6
> {'a': 0, 'I': 0, 'am': 0, 'list': 0, 'of': 0, 'strings': 0}
“啊!” 我认为。这是世界上最容易修复的错误。我正在做整数除法。我不想做整数除法。只需将其中一个条款设为浮动即可。巴姆。
def tf2(listOfStrs):
print len(listOfStrs)
thedict = dict((x,listOfStrs.count(x)/float(len(listOfStrs)) for x in set(listOfStrs))
print thedict
> File "<ipython-input-13-db67e35f2596>", line 3
> thedict = dict((x,listOfStrs.count(x)/float(len(listOfStrs)) for x in set(listOfStrs))
> ^
> SyntaxError: invalid syntax
???我知道 for 语句中没有语法错误,因为它在前两个版本中运行良好。嗯。所以显然铸造浮动打破了听写理解。但这似乎很疯狂。它只是将一个 int 转换为一个浮点数。这是世界上最简单的操作……它是如何破坏听写理解的?
我完全被这个难住了……有人有什么好主意吗?