在尝试使用 NLTK 词性标记时,我注意到VBP
在调用nltk.pos_tag
. 我注意到这个标签不在布朗语料库的词性标签集中。然而,它是 UPenn 标记集的一部分。
nltk 默认使用什么标签集?我在官方文档或 apidocs 中找不到这个。
Ntlk 使用 PennTreebank 标记集。看看这个链接http://nltk.org/api/nltk.tag.html
它使用 Penn Treebank 项目中使用的 POS 标签。您可以在“ http://www.ling.upenn.edu/courses/Fall_2003/ling001/penn_treebank_pos.html ”上查看具有含义的标签列表