java - 使用 java、nlp 的短语级依赖解析器

Question

有人可以详细说明如何使用斯坦福大学的自然语言处理词法分析器-开源 Java 代码获得“短语级别的依赖”吗？ http://svn.apache.org/repos/asf/nutch/branches/branch-1.2/src/plugin/lib-http/src/java/org/apache/nutch/protocol/http/api/RobotRulesParser.java

如

阶段依赖

事故-------->发生了

下降 ---------> 作为

夜 ----------> 坠落

诸如此类...

谢谢！

score 0 · Accepted Answer

您可以将单词分组到一个标记中，这样您就可以获得短语级别的依赖。至少，这涵盖了多词表达式 (MWE) 和命名实体。这也可以提高依赖解析期间的准确性（特别是对于将命名实体分组为一个标记）。

在您的示例中，在将确定器组合在一起时，我认为您可以做的就是对它们进行后处理。得到依赖解析树后，可以将“the”添加到“accident”中。如果需要，您可以从组成分析树中建立它，

(NP (DT The) (NN accident))

查看属于同一名词短语或其他短语的那些。不太确定这将如何有用，或者这种方法可能会出现什么问题。您可以使用斯坦福解析器( demo )进行一些实验。

1 回答 1