0

有人可以详细说明如何使用斯坦福大学的自然语言处理词法分析器-开源 Java 代码获得“短语级别的依赖”吗? http://svn.apache.org/repos/asf/nutch/branches/branch-1.2/src/plugin/lib-http/src/java/org/apache/nutch/protocol/http/api/RobotRulesParser.java

http://docs.mongodb.org/manual/reference/sql-comparison/

阶段依赖

事故-------->发生了

下降 ---------> 作为

夜 ----------> 坠落

诸如此类...

谢谢!

4

1 回答 1

0

您可以将单词分组到一个标记中,这样您就可以获得短语级别的依赖。至少,这涵盖了多词表达式 (MWE) 和命名实体。这也可以提高依赖解析期间的准确性(特别是对于将命名实体分组为一个标记)。

在您的示例中,在将确定器组合在一起时,我认为您可以做的就是对它们进行后处理。得到依赖解析树后,可以将“the”添加到“accident”中。如果需要,您可以从组成分析树中建立它,

(NP (DT The) (NN accident))

查看属于同一名词短语或其他短语的那些。不太确定这将如何有用,或者这种方法可能会出现什么问题。您可以使用斯坦福解析器( demo )进行一些实验。

于 2012-08-21T11:17:52.437 回答