1

我有一串单词说s1。我在其他集合中也有多个字符串,例如 s2、s3、s4。

我想将字符串 s1 中的单词与每个字符串 s2、s3 等进行匹配。根据最大相似度得分,我想找出 s2、s3 中的哪些字符串与 s1 最大匹配。

我想使用 wordNet 的 PATH 算法。请建议,什么应该是最好的方法。

4

1 回答 1

3

为了在 WordNet 中使用路径相似度,首先您需要使用 WordNet 中的同义词来消除每个单词的歧义。然后你可以计算两个文本的基于 WordNet 的相似度。

本文中,他们使用 Wu-Palmer 路径相似度将其称为概念相似度。他们基本上将同义词集视为文本中的概念,将 Wu-Palmer 路径相似度视为概念相似度度量。

如果pq是两个文本,并且C_pC_q是这两个文本中对应的同义词集,则两个文本的概念相似度由下式计算:

ss(p, q) = \frac{\sum_{c_1 \in C_p}{\max_{c_2 \in C_q} s(c_1, c_2)}}{|  C_p |}

s(c_1, c_2)是两个同义词集的 Wu-palmer 相似性。

于 2015-07-06T12:04:49.757 回答