我有具有某些属性和客户类型的客户数据库。属性的集合可能会有所不同(尽管它们确实来自有限集),当我查看具有给定属性的未知类型的新客户时,我想确定他/她属于哪种类型。例如,假设我已经在 DB 中有这些客户,
Customer | Type | Attributes
1 A 44,32,5,'X'
2 A 3,32,66,'A'
3 B 6,32,'A', 'B'
4 C 47,31,2,'H'
5 C 14,32,2,'O'
6 C 2,'C'
7 A 44
当我收到一个具有属性的新客户时,例如,3,32,2,我想确定这个客户属于哪个类型,代码应该报告它对这次匹配的置信度(以百分比表示)。
在这里使用的最佳方法是什么?统计的东西,或基于某种亲和矩阵的方法,或推荐引擎风格的基于皮尔逊相关系数的方法?示例,伪代码将是最受欢迎的,但任何想法都可以。
谢谢,