syntaxnet - Parsey mcparseface：如何获取句子中单词的位置以及解析树

Question

我正在使用 parsey mcparseface 和 syntaxnet 来解析一些文本。我希望提取单词的位置数据以及解析树。

目前的输出是：

echo 'Alice brought the pizza to Alice.' | syntaxnet/demo.sh

Input: Alice brought the pizza to Alice .
Parse:
brought VBD ROOT
 +-- ALice NNP nsubj
 +-- pizza NN dobj
 |   +-- the DT det
 +-- to IN prep
 |   +-- Alice NNP pobj
 +-- . . punct

我需要怎样

Input: Alice brought the pizza to Alice .
Parse:
brought VBD ROOT 2
 +-- Alice NNP nsubj 1
 +-- pizza NN dobj 4
 |   +-- the DT det 3
 +-- to IN prep 5
 |   +-- Alice NNP pobj 6
 +-- . . punct 7

或类似的。（当同一个词出现很多次时，这将特别有用。）

谢谢

score 2 · Accepted Answer

您可以编辑 conll2tree.py https://github.com/tensorflow/models/blob/master/syntaxnet/syntaxnet/conll2tree.py

更改token_str为

token_str = ['%s %d %s %s' % (token.word, tind,
           token.tag, token.label)
           for tind,token in enumerate(sentence.token,1)]

应该这样做。

syntaxnet - Parsey mcparseface：如何获取句子中单词的位置以及解析树

1 回答 1

Related

Reference