我使用带有树库语料库的标记器来使用 NLTK 对句子进行 POS 标记。句子是“猫吃了狗”。出于某种原因,它将“ate”标记为 NN,而它应该是动词。有什么线索吗?
from nltk.tag import pos_tag
from nltk.tokenize import word_tokenize
pos_tag(word_tokenize("The cat ate the dog"))
[出去]:
[('The', 'DT'), ('cat', 'NN'), ('ate', 'NN'), ('the', 'DT'), ('dog', 'NN')]