0

这很奇怪。我正在尝试实现文本频率计算,并在 ipython 笔记本中使用 python 2.7 运行以下代码。三个版本的函数。

第一个版本,只需计算字符串列表中单词的实例并将其粘贴到字典中:

testList = ['I', 'am', 'a', 'list', 'of', 'strings']

def tf1(listOfStrs):
    thedict = dict((x,listOfStrs.count(x)) for x in set(listOfStrs))
    print thedict

# produces expected output: 
> {'a': 1, 'I': 1, 'am': 1, 'list': 1, 'of': 1, 'strings': 1}

好的,这工作正常。通过将每次出现除以单词总数来实际获得频率的时间。应该产生 0.16... 等

def tf2(listOfStrs):
    print len(listOfStrs)
    thedict = dict((x,listOfStrs.count(x)/len(listOfStrs)) for x in set(listOfStrs))
    print thedict

tf2(testList)
> 6
> {'a': 0, 'I': 0, 'am': 0, 'list': 0, 'of': 0, 'strings': 0}

“啊!” 我认为。这是世界上最容易修复的错误。我正在做整数除法。我不想做整数除法。只需将其中一个条款设为浮动即可。巴姆。

def tf2(listOfStrs):
    print len(listOfStrs)
    thedict = dict((x,listOfStrs.count(x)/float(len(listOfStrs)) for x in set(listOfStrs))
    print thedict

>   File "<ipython-input-13-db67e35f2596>", line 3
>     thedict = dict((x,listOfStrs.count(x)/float(len(listOfStrs)) for x in set(listOfStrs))
>                                                                    ^
> SyntaxError: invalid syntax

???我知道 for 语句中没有语法错误,因为它在前两个版本中运行良好。嗯。所以显然铸造浮动打破了听写理解。但这似乎很疯狂。它只是将一个 int 转换为一个浮点数。这是世界上最简单的操作……它是如何破坏听写理解的?

我完全被这个难住了……有人有什么好主意吗?

4

1 回答 1

0

根据这个元讨论,我将代表 Tim Peters 回答这个问题并将其标记为社区 wiki。

你的括号不平衡。添加时float(,您忘记添加).

于 2015-06-21T18:33:07.907 回答