我正在开发一个向用户推荐内容的项目。我想从每个用户创建一个配置文件,以便我可以对它们进行聚类并提供共同的建议,但在我必须能够衡量这些用户之间的相似性之前。我曾想过一份可以使用模糊标签填写的问卷。
我的问题是如何测量回答此类问题的两个用户 U1 和 U2 的相关性(相似性)?
- Q1。我认为东京是一个不错的城市。U1:完全同意 U2:部分同意
- Q2。我读过堂吉诃德。U1:完全不同意U2:完全同意
- ...
- Qn。我认为塔伦蒂诺是一位出色的电影导演。U1: 部分同意U2:部分同意
我曾想过将答案转换为数值,然后尝试计算皮尔逊相关系数。但我想知道是否有更优雅的方法可以做到这一点。