查看 Penn Treebank 标签集 ( http://web.mit.edu/6.863/www/PennTreebankTags.html#RB ) 有一个名为“功能标签”的部分,这对我正在进行的项目非常有帮助。我知道斯坦福解析器将 Penn Treebank 标记集用于其 EnglishPCFG 语法,所以我希望支持函数标记。
使用斯坦福解析器和 NLTK,我已经解析了带有子句、短语和单词级别标签以及通用依赖项的句子,但我还没有找到从解析的句子中获取函数标签的方法。
parser=StanfordParser(model_path="edu/stanford/nlp/models/lexparser/englishPCFG.ser.gz")
parsed = parser.raw_parse("Jack payed up to 5% more for each unit")
for line in parsed:
print line
打印出来:
(ROOT
(S
(NP (NNP Jack))
(VP
(VBD payed)
(PRT (RP up))
(PP (TO to) (NP (QP (CD 5) (NN %) (JJR more))))
(PP (IN for) (NP (DT each) (NN unit))))))
对于这个例子,我希望有一个带有介词“最多 5% 以上”的 -EXT(范围)功能标签,尽管我不确定实际输出会是什么样子。
是否可以使用 Stanford Parser 和 NLTK 查看已解析句子的功能标签?如果是这样,我该如何做到这一点?