我正在研究为一家电信公司开发推荐引擎的案例研究。目标是向新客户推荐合适的产品。我们计划遵循的逻辑是将他的个人资料(如年龄、就业、性别等)与我们现有的客户数据库进行比较,以找到相似的客户并推荐这些客户最常用的产品。样本数据如下:
customerID gender SeniorCitizen Partner Dependents tenure PhoneService Contract Package
7590-VHVEG Female 0 Yes No 1 No Month-to-month Package1
5575-GNVDE Male 0 No No 34 Yes One year Package2
3668-QPYBK Male 0 No No 2 Yes Month-to-month Package1
我遇到了许多相似度测量技术,如余弦相似度、欧几里德距离、皮尔逊相关系数等,但无法将适合我情况的东西归零。
请您指导我如何开始?虽然我打算在 R 中做这件事,但目前我没有在寻找任何代码。