7

我正在使用 Wordnet 来查找本体概念的同义词。我怎样才能找到适合我的本体概念的意义。例如,有一个本体概念“会议”,它在 wordnet 中有以下同义词 名词会议有 3 种意义(前 3 种来自标记文本)

  1. (12) 会议——(预先安排的协商或交换信息或讨论的会议(尤其是有正式议程的会议))
  2. (2) 联赛、会议——(为其成员组织比赛的运动队协会)
  3. (2) 会议、小组讨论——(有一致(严肃)主题的参与者之间的讨论)现在第一个和第三个同义词对我的本体概念有适当的意义。我怎样才能从wordnet中只选择这两个?
4

3 回答 3

5

您正在寻找的技术是语义消歧/表示的方向。

最“传统的做法”是词义消歧(WSD),看看

然后是下一代词义归纳/主题建模/知识表示

然后是最近的炒作:

  • 词嵌入、向量空间模型、神经网络

有时人们跳过语义表示,直接做文本相似性,通过比较句子对,在达到文本处理的最终目标之前的差异/相似性。

查看STS 相关工作列表的Normalize ranking score with weights 。

在另一个方向,有

最近还有一个关于本体归纳/扩展的任务:

根据最终任务,也许上述任何一种技术都会有所帮助。

于 2015-08-12T08:36:03.263 回答
0

你也可以试试 Babelfy,它提供了词义消歧和命名实体消歧。

演示: http ://babelfy.org/

API: http ://babelfy.org/guide

于 2016-06-06T08:49:02.990 回答
0

看看这个列表:100 Best GitHub:Word-sense Disambiguation and search by WordNet - 有几个合适的库。

我一个都没用过,但是这个似乎很有前途,因为它是基于经典而有效的思想(即Lesk 算法),通过现代词嵌入方法升级而来的。实际上,在找到它之前,我会建议尝试几乎相同的想法。

另请注意,所有方法都试图找到与当前单词/搭配的上下文最相似的含义(WordNet sysnet,在您的情况下),因此了解您要消除歧义的单词的上下文至关重要。例如,单词可以来自某些文本,而大多数库都依赖于此。

于 2016-06-08T16:04:26.280 回答