我正在尝试使用包含连续特征和一些二进制特征的数据集在 python 中构建逻辑回归。
为了选择我将包含在模型中的功能,我正在使用 RFE。所以基本上我有这个代码
y=HRData['left']
collist = HRData.columns.tolist()
collist.remove('left')
X=HRData[collist]
model = LogisticRegression()
rfe = RFE(model, 10)
fit = rfe.fit(HRData[X], HRData[y])
其中 y 包含 1 和 0,而 X 具有 int 或 float 数据。
当我尝试用 RFE 拟合模型时,我不断得到这个:
/anaconda3/lib/python3.6/site-packages/pandas/core/frame.py in
_getitem_frame(self, key)
2033 def _getitem_frame(self, key):
2034 if key.values.size and not is_bool_dtype(key.values):
-> 2035 raise ValueError('Must pass DataFrame with boolean values only')
2036 return self.where(key)
2037
ValueError:必须仅通过布尔值传递 DataFrame
所以我不确定这个函数是否只接受带有布尔值的数据帧,因为我已经看到了带有连续变量的例子。
在此先感谢您的帮助!