java - 斯坦福依赖转换工具

Question

斯坦福依赖手册（http://nlp.stanford.edu/software/dependencies_manual.pdf）提到：“或者我们的转换工具可以将其他选区解析器的输出转换为斯坦福依赖表示。”

有谁知道该工具在哪里可用或如何使用它？

斯坦福解析器文档 ( http://nlp.stanford.edu/software/stanford-dependencies.shtml ) 提到：“可以使用我们的软件 [...] 使用 EnglishGrammaticalStructure 类在短语结构树上获得依赖关系解析器包。”

我有兴趣获取（ccprocessed）类型的依赖列表以在 NLTK 中使用。我看到有一个构造函数 EnglishGrammaticalStructure(Tree t)，我想要一些关于如何为其提供 NLTK 树的指导。

第一个想法：使用 nltk.tree.Tree.pprint 生成一个字符串，然后使用 Java 中的 Tree.valueOf 对其进行解析。有什么建议吗？

我可以从另一个解析器生成的树中获取您的类型化依赖项（语法关系）输出吗？

您可以使用EnglishGrammaticalStructure的主要方法。你可以给它像 -treeFile 这样的选项来读取树，比如，-collapsed 来输出 typedDependenciesCollapsed。例如，此命令（带有适当的路径）会将 Penn Treebank 文件转换为未折叠的类型依赖项：

java -cp stanford-parser.jar edu.stanford.nlp.trees.EnglishGrammaticalStructure -treeFile wsj/02/wsj_0201.mrg -basic

[...]

此处的mrg文件是“合并的”（即 POS 标签和短语结构）Penn Treebank 表示，如果您使用适当的语法定义，您可以获得 NLTK 的 Tree.pprint 来发出。但是，我无法对此进行扩展，因为问题描述没有涉及为什么必须流水线化这两个工具。

java - 斯坦福依赖转换工具

1 回答 1

我可以从另一个解析器生成的树中获取您的类型化依赖项（语法关系）输出吗？

Related

Reference