13

有没有办法使用 OpenNLP 获取句子的主题?我正在尝试识别用户句子中最重要的部分。通常,用户将向我们的“引擎”提交句子,我们想确切地知道该句子的核心主题是什么。

目前我们正在使用 openNlp 来:

  1. 把句子分块
  2. 识别句子的名词短语、动词等
  3. 识别句子的所有“主题”
  4. (尚未完成!)确定句子的“核心主题”

如果你有什么好主意,请告诉我..

4

2 回答 2

17

依赖解析器

如果您有兴趣提取语法关系,例如句子的主语是什么单词或短语,那么您真的应该使用依赖解析器。虽然 OpenNLP 确实支持短语结构解析,但我认为它还没有进行依赖解析。

开源软件

用 Java 编写的支持依赖解析的包包括:

其中,Stanford Parser 是最准确的。然而,MaltParser 的某些配置可能非常快(Cer et al. 2010)。

于 2011-04-05T23:55:17.383 回答
2

对于语法主题,您需要依赖树中的配置信息。如果解析看起来像 (TOP (S (NP ----) (VP ----))) 那么您可以将 NP 作为主语;通常,尽管并非总是如此,但情况确实如此。然而,只有一些句子会有这种配置;人们可以很容易地想象具有不在那个位置的主体的结构——例如被动结构。

不过,使用 MaltParser 可能会更好。

于 2011-12-23T02:07:06.963 回答