3

什么是最好的交钥匙(即用型、工业级)关系检测库?

我一直在玩 NLTK,我得到的结果不是很令人满意。

理想情况下,我想要一个可以接受以下句子的库:

“莎拉杀死了一只正在吃孩子的狼”

并将其转换为一种数据结构,其含义类似于:

杀死(莎拉,狼)和吃(狼,孩子)

我知道这是大量研究的主题,而且这不是一件容易的事。也就是说,是否有人知道用于检测关系的相当健壮的即用型库?

4

2 回答 2

1

更新:Extractiv 不再可用。

Extractiv按需REST 服务: http ://rest.extractiv.com/extractiv/?url=https://stackoverflow.com/questions/4732686/best-turnkey-relation-detection-library&output_format=html_viewer将处理这个页面,在“通用”下的左下角提取并显示您想要的两个语义三元组。(它会从 html 查看器中的页面中丢弃一些文本,但如果您使用 json 或 rdf 输出,则不会丢弃此文本)。

这是假设您对商业、工业强度的解决方案持开放态度,但允许有限的免费使用。它是一种网络服务,但可以使用开源库来访问它,或者可以从Language Computer Corporation购买。

于 2011-01-19T15:40:05.373 回答
1

这些关系可以很容易地从依赖符号的输出中读取出来。例如,放入Stanford Parser online,您可以在类型化依赖项折叠表示中看到示例中的两个主语-动词-宾语三元组:

nsubj(killed-2, Sarah-1)
dobj(killed-2, wolf-4)

nsubj(eating-7, wolf-4)
dobj(eating-7, child-9)
于 2011-01-26T08:32:17.933 回答