7

当我在字符串上运行以下代码时words

def word_feats(words):
    return dict([(word, True) for word in words])
print(word_feats("I love this sandwich."))

我得到字母而不是单词的输出dict-comprehension:

{'a': True, ' ': True, 'c': True, 'e': True, 'd': True, 'I': True, 'h': True, 'l': True, 'o': True, 'n': True, 'i': True, 's': True, 't': True, 'w': True, 'v': True, '.': True}

我究竟做错了什么?

4

2 回答 2

8

您需要在空格上显式拆分字符串:

def word_feats(words):
    return dict([(word, True) for word in words.split()])

这使用str.split()不带参数,在任意宽度的空白处拆分(包括制表符和行分隔符)。否则,字符串是单个字符的序列,直接迭代实际上只会遍历每个字符。

但是,拆分为单词必须是您需要自己执行的显式操作,因为不同的用例对如何将字符串拆分为单独的部分有不同的需求。例如,标点符号算不算?括号或引用呢,也许按这些分组的单词不应该分开?等等。

如果您所做的只是将所有值设置为True,那么使用它会更有效dict.fromkeys()

def word_feats(words):
    return dict.fromkeys(words.split(), True)

演示:

>>> def word_feats(words):
...     return dict.fromkeys(words.split(), True)
... 
>>> print(word_feats("I love this sandwich."))
{'I': True, 'this': True, 'love': True, 'sandwich.': True}
于 2014-04-23T12:15:26.217 回答
4

你必须字符串splitwords

def word_feats(words):
    return dict([(word, True) for word in words.split()])
print(word_feats("I love this sandwich."))

例子

>>> words = 'I love this sandwich.'
>>> words = words.split()
>>> words
['I', 'love', 'this', 'sandwich.']

您还可以使用其他字符进行拆分:

>>> s = '23/04/2014'
>>> s = s.split('/')
>>> s
['23', '04', '2014']

你的代码

def word_feats(words):
    return dict([(word, True) for word in words.split()])
print(word_feats("I love this sandwich."))

[OUTPUT]
{'I': True, 'love': True, 'this': True, 'sandwich.': True}
于 2014-04-23T12:15:24.110 回答