我正在尝试计算两个单词之间的语义相似度。我正在使用基于 Wordnet 的相似性度量,即 Resnik 度量 (RES)、Lin 度量 (LIN)、Jiang 和 Conrath 度量 (JNC) 以及 Banerjee 和 Pederson 度量 (BNP)。
为此,我使用的是 nltk 和 Wordnet 3.0。接下来,我想组合从不同度量中获得的相似度值。为此,我需要对相似度值进行归一化,因为某些度量给出的值介于 0 和 1 之间,而另一些给出的值大于 1。
所以,我的问题是如何标准化从不同测量中获得的相似度值。
关于我实际尝试做的额外细节:我有一组单词。我计算单词之间的成对相似度。并删除与集合中其他单词不强相关的单词。