0

我只是在使用 Python 学习 nltk。我正在使用 POS 标记。我想知道的是如何使用标签。例如,这是伪代码:

words = []
teststr = "George did well in the test."
tokens = nltk.word_tokenize(teststr)
words = nltk.pos_tag(tokens)

我想做这样的事情:

if words[i] == "proper noun":
    #do something

如何检查一个词是名词还是动词或任何其他词性。有人可以帮我吗?谢谢。

4

1 回答 1

2

如果您查看 pos_tag 函数调用的结果,则会返回以下列表:

[('George', 'NNP'), ('did', 'VBD'), ('well', 'RB'), ('in', 'IN'), ('the', 'DT'), ('test', 'NN'), ('.', '.')]

如果您遍历列表以根据专有名词的值执行某些操作,则需要以下代码:

if words[i][1] == 'NNP':
    # do something

NNP 是单数专有名词。该列表中的每个条目都是一个元组,其中第一个值是单词,第二个值是 pos。

于 2013-03-22T23:31:13.683 回答