我刚刚开始使用 SAS Visual Analytics,我想将我在训练样本上构建的逻辑回归应用到我想要进行预测的测试样本上。让我更清楚:
数据
该数据与一个虚构的电子商务网站有关。我的兴趣是根据一系列观察到的变量来计算客户完成购买的概率。
训练样本
因变量:取 0/1 的值,表示客户是否购买(或不购买)
自变量:它们是一系列二进制变量,指示客户可能执行的某些操作(例如,“添加到购物车”;“检查运输详细信息”;...)。数据集如下所示:
用户身份 | 已订购 | 查看购物车 | View_shipping |
---|---|---|---|
1 | 0 | 1 | 0 |
2 | 1 | 0 | 1 |
3 | 1 | 1 | 0 |
4 | 0 | 0 | 1 |
5 | 1 | 1 | 0 |
我需要进行预测的样本
测试样本包含与训练样本相同的信息,但我需要预测的因变量。该数据集如下所示:
用户身份 | 查看购物车 | View_shipping |
---|---|---|
8 | 0 | 1 |
9 | 0 | 1 |
10 | 1 | 0 |
11 | 1 | 0 |
12 | 1 | 0 |
到目前为止,我已经运行了回归,使用分区来训练测试使用训练样本的回归。下一步是将回归得到的结果应用于我需要对其进行预测以获得购买预测的样本。
希望一切都清楚