0

有没有办法将余弦相似度列表转换为百分比?我试图把我的大脑包裹起来,但我很怀疑。

像这样标准化四个文档的余弦值是否有意义:

Doc #1  0.9600
Doc #2  0.9300
Doc #3  0.8800
Doc #4  0.8500

总结他们

0.9600 + 0.9300 + 0.8800 + 0.8500 = 3.6200

并使它们正常化。

Doc #1  0.9600 / 3.6200 = 0.2652
Doc #2  0.9300 / 3.6200 = 0.2570
Doc #3  0.8800 / 3.6200 = 0.2431
Doc #4  0.8500 / 3.6200 = 0.2348

还是有更可接受的显示方式?

4

1 回答 1

2

我想这取决于您的用例,但总的来说,我认为没有必要对余弦相似度分数进行归一化,因为它们已经处于 0 到 1 的范围内。

于 2013-01-15T14:54:56.497 回答