0

我正在创建一个项目,我将在其中接收推文列表(Twitter),然后检查 a 中是否有单词dictionary,其中包含具有特定值的单词。我已经得到了我的代码来接受这些词,但我不知道如何消除这些符号,比如, . "::

这是代码:

def getTweet(tweet, dictionary):
score = 0
seperate = tweet.split(' ')
print seperate
print "------"    
if(len(tweet) > 0):
    for item in seperate:
        if item in dictionary:
            print item
            score = score + int(dictionary[item])
    print "here's the score: " + str(score)
    return score
else:
    print "you haven't tweeted a tweet"
    return 0

这是将要检查的参数/推文:

getTweet("you are the best loyal friendly happy cool nice", scoresDict)

有任何想法吗?

4

2 回答 2

1

如果您想摆脱所有非字母数字值,您可以尝试:

import re
re.sub(r'[^\w]', ' ', string)

标志 [^\w] 将为您解决问题!

于 2013-08-28T04:42:27.253 回答
0

在进行拆分之前,将字符替换为空格,然后在空格上进行拆分。

import re

line = '  a.,b"c'
line = re.sub('[,."]', ' ', line)

print line  # '  a  b c'
于 2013-08-28T04:38:51.770 回答