我有一串单词说s1。我在其他集合中也有多个字符串,例如 s2、s3、s4。
我想将字符串 s1 中的单词与每个字符串 s2、s3 等进行匹配。根据最大相似度得分,我想找出 s2、s3 中的哪些字符串与 s1 最大匹配。
我想使用 wordNet 的 PATH 算法。请建议,什么应该是最好的方法。
我有一串单词说s1。我在其他集合中也有多个字符串,例如 s2、s3、s4。
我想将字符串 s1 中的单词与每个字符串 s2、s3 等进行匹配。根据最大相似度得分,我想找出 s2、s3 中的哪些字符串与 s1 最大匹配。
我想使用 wordNet 的 PATH 算法。请建议,什么应该是最好的方法。
为了在 WordNet 中使用路径相似度,首先您需要使用 WordNet 中的同义词来消除每个单词的歧义。然后你可以计算两个文本的基于 WordNet 的相似度。
在本文中,他们使用 Wu-Palmer 路径相似度将其称为概念相似度。他们基本上将同义词集视为文本中的概念,将 Wu-Palmer 路径相似度视为概念相似度度量。
如果p和q是两个文本,并且和是这两个文本中对应的同义词集,则两个文本的概念相似度由下式计算:
这是两个同义词集的 Wu-palmer 相似性。