所以我正在研究我朋友正在进行的这项分析,他在不同地点有两组零售店。A 组包括那些在销售方面表现非常出色并达到领导基准的公司,而 B 组则没有。还有一些与销售无关的数据,例如员工人数、库存类别、与住宅区的距离等。他的目标是在 B 组中找到与 A 组在这些非销售参数上相似的商店并支付更多地关注那些。
令我惊讶的是,他在 SAS 中使用 PROC PMBR 方法 = RDTree,在那里他训练了 B 组的数据并在 A 组上评分。他得到的最终输出是 B 组中“最相似”的商店列表到 A 组。目标变量只有 1,没有 0 值。有人可以向我解释这种方法是否正确,因为 pmbr 主要用于 KNN 分类算法。它也可以用于在没有适当的二进制标签的情况下识别相似性吗?