2

查看 Penn Treebank 标签集 ( http://web.mit.edu/6.863/www/PennTreebankTags.html#RB ) 有一个名为“功能标签”的部分,这对我正在进行的项目非常有帮助。我知道斯坦福解析器将 Penn Treebank 标记集用于其 EnglishPCFG 语法,所以我希望支持函数标记。

使用斯坦福解析器和 NLTK,我已经解析了带有子句、短语和单词级别标签以及通用依赖项的句子,但我还没有找到从解析的句子中获取函数标签的方法。

parser=StanfordParser(model_path="edu/stanford/nlp/models/lexparser/englishPCFG.ser.gz")
parsed = parser.raw_parse("Jack payed up to 5% more for each unit")
for line in parsed:
    print line

打印出来:

(ROOT
  (S
    (NP (NNP Jack))
    (VP
      (VBD payed)
      (PRT (RP up))
      (PP (TO to) (NP (QP (CD 5) (NN %) (JJR more))))
      (PP (IN for) (NP (DT each) (NN unit))))))

对于这个例子,我希望有一个带有介词“最多 5% 以上”的 -EXT(范围)功能标签,尽管我不确定实际输出会是什么样子。

是否可以使用 Stanford Parser 和 NLTK 查看已解析句子的功能标签?如果是这样,我该如何做到这一点?

4

0 回答 0