我有 2 个数据行,每个数据行都有 4 个字段
像这样的东西:
field1 field2 field3 field4
Row 1
Row 2
现在我必须比较这两条记录并计算相似度。我通过导出余弦相似度来计算每个字段的相似度。
所以我最终得到了类似这样的相似之处:(0表示一周相似,1表示高度相似)
field1: 0.12
field2: 0.67
field3: 1.00
field3: 0.93
我现在可以通过平均该值来找到总相似度,但问题是:
我想为字段添加权重
所以如果 field2 的权重高于 field1,那么 field2 的相似度将对平均相似度有显着的贡献。
你能推荐一个公式或算法来满足这样的要求吗?