1

如何使用相对频率计算两个文档(例如 D1 和 D2)之间的欧几里德距离(相似度) ?

下面是使用绝对频率的两个文档之间的余弦和欧几里得距离的示例。

D1 (frequencies) = 4,9,7,0,0,3. = {16+81+49+9} = sqrt (155) = 12.45

D2 (frequencies) = 4,5,0,7,5,0. = {16+25+49+25} = sqrt (115) = 10.72

余弦 D1,D2 = (4x4+9x5) / 12.45x10.72 = 0.4569(绝对频率和相对频率)余弦绝对频率与相对频率相同

欧几里得 D1, D2 = sqrt( sqr(4-4) + sqr(9-5) + sqr(7) + sqr(7) + sqr(5) + sqr(3) ) =sqrt( 0+16+49+ 49+25+9) = sqrt( 148 ) = 12.17(绝对频率)。

相对频率为0.2532

我试图获得这个问题的相对频率(欧几里得),我还没有找到任何有帮助的教程。在没有公式或解释的情况下,我只能找到答案0.2532 。

4

1 回答 1

0

在这里阅读欧几里得距离以获得更好的理解

于 2017-11-11T10:36:42.223 回答