11

我有兴趣从问题中提取三元组(主语、谓语、宾语)。

例如,我想转换以下问题:

美国总统的夫人是谁?

至 :

(x,isWifeOf,y) ∧ (y,isPresidentof,USA)

x 和 y 是我们必须找到才能回答问题的未知数(/\ 表示连词)。

我已经阅读了很多关于这个主题的论文,我想使用现有的解析器(如斯坦福解析器)来执行这个任务。我知道解析器输出两种类型的数据:

  • 解析结构树(选区关系)
  • 依赖树(依赖关系)

一些论文试图从解析结构树构建三元组(例如,从句子中提取三元组),但是这种方法似乎太弱而无法处理复杂的问题。

另一方面,依赖树包含许多相关信息来执行三重提取。很多论文都声称可以做到这一点,但是我没有找到任何一篇明确给出详细程序或算法的论文。大多数时候,作者说他们分析依赖关系以根据他们没有给出的一些规则生成三元组。

有谁知道任何有关从问题的依赖树中提取(主语、谓语、宾语)的更多信息的论文?

4

1 回答 1

0

Textacy有一个不错的三重提取实现。它建立在 SpaCy 之上,SpaCy是 Python 中流行的 NLP 库。您似乎对三重提取的底层算法特别感兴趣,因此查看他们算法的源代码可能会给您一些启发。见这里:https ://textacy.readthedocs.io/en/stable/_modules/textacy/extract.html#subject_verb_object_triples

于 2020-10-30T21:17:49.007 回答