我有一些数据,数据集包括设备 ID(int)、电话(int)、名称(字符串)、设备 ID等特征。但所有数据都没有标签。我的任务是获取一个人使用多个 ID 或多个设备的概率。我不知道该怎么做,有人有想法吗?
为了清楚起见,这里是一个例子。数据集就像
name id phone device_id
Jason 123 12345 12341231 ......
James 1345 312312 312312312 ......
Jason 123 53523 23115124 ......
所以我们可以发现 Jason 有 2 个电话号码,
我如何使用机器学习方法或深度学习方法获得概率?