0

我有一个数据集,无论统计相关性如何,我都需要包含一些变量,但我想为其余变量运行分数选择(即最佳子集)。我想知道是否有办法指定分数选择方法以保持每个模型适合的特定变量。无论统计显着性如何,我的变量都需要以“kp_”为前缀

proc logistic work.data;
    model y (event ='1')= kp_x1 kp_x2 x3 x4 x5 x6 x7 / selection=score best=3;
run;
4

1 回答 1

1

在模型语句中使用include=选项将保留列出的前n 个变量。

例如,使用您的代码,要保留 *kp_x1* 和 *kp_x2* 变量,您可以编写:

proc logistic work.data;
  model y (event ='1')= kp_x1 kp_x2 x3 x4 x5 x6 x7 / selection=score best=3 include=2;
run;
于 2014-04-03T11:46:00.480 回答