-5

我正在从各种网站提取评论并将它们存储在一个文件中,然后在 senti-wordnet 的帮助下将每个句子分类为正面或负面(它给出了某些分数)。我使用的是 python 2.7。我不知道它对存储在文件中的评论是如何工作的。有人知道python中的代码吗?

f1=open("foodP.txt","r")
word_features =[]
words = []

for line in f1:
    word_features.append(line)
    s=str(word_features)
    tokens=nltk.word_tokenize(s)    

for i,j in nltk.pos_tag(tokens):
    if j in ['VBN','VBP','VB','JJ', 'JJR', 'JJS', 'RB', 'RBR', 'RBS']:
        words.append(i)
print words

这段代码只会给出我需要的形容词、副词和动词。我想将这些词分类为正面或负面。

4

1 回答 1

1

您不需要 POS 来进行情绪分析,至少不需要。通过使用 X 中的 bag_of_words 和 "neg"/"pos" 作为 Y 来准备特征。然后分成训练/测试集并应用分类算法 - NaiveBayes、MaxEnt、RandomForest、SVM。

于 2016-03-04T11:06:53.563 回答