如何使用相对频率计算两个文档(例如 D1 和 D2)之间的欧几里德距离(相似度) ?
下面是使用绝对频率的两个文档之间的余弦和欧几里得距离的示例。
D1 (frequencies) = 4,9,7,0,0,3. = {16+81+49+9} = sqrt (155) = 12.45
D2 (frequencies) = 4,5,0,7,5,0. = {16+25+49+25} = sqrt (115) = 10.72
余弦 D1,D2 = (4x4+9x5) / 12.45x10.72 = 0.4569(绝对频率和相对频率)余弦绝对频率与相对频率相同
还
欧几里得 D1, D2 = sqrt( sqr(4-4) + sqr(9-5) + sqr(7) + sqr(7) + sqr(5) + sqr(3) ) =sqrt( 0+16+49+ 49+25+9) = sqrt( 148 ) = 12.17(绝对频率)。
相对频率为0.2532 。
我试图获得这个问题的相对频率(欧几里得),我还没有找到任何有帮助的教程。在没有公式或解释的情况下,我只能找到答案0.2532 。