Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
有没有办法使用 OpenNLP 获取句子的主题?我正在尝试识别用户句子中最重要的部分。通常,用户将向我们的“引擎”提交句子,我们想确切地知道该句子的核心主题是什么。
目前我们正在使用 openNlp 来:
如果你有什么好主意,请告诉我..
依赖解析器
如果您有兴趣提取语法关系,例如句子的主语是什么单词或短语,那么您真的应该使用依赖解析器。虽然 OpenNLP 确实支持短语结构解析,但我认为它还没有进行依赖解析。
开源软件
用 Java 编写的支持依赖解析的包包括:
其中,Stanford Parser 是最准确的。然而,MaltParser 的某些配置可能非常快(Cer et al. 2010)。
对于语法主题,您需要依赖树中的配置信息。如果解析看起来像 (TOP (S (NP ----) (VP ----))) 那么您可以将 NP 作为主语;通常,尽管并非总是如此,但情况确实如此。然而,只有一些句子会有这种配置;人们可以很容易地想象具有不在那个位置的主体的结构——例如被动结构。
不过,使用 MaltParser 可能会更好。