1

我正在尝试使用包含连续特征和一些二进制特征的数据集在 python 中构建逻辑回归。

为了选择我将包含在模型中的功能,我正在使用 RFE。所以基本上我有这个代码

y=HRData['left']
collist = HRData.columns.tolist()
collist.remove('left')
X=HRData[collist]
model = LogisticRegression()
rfe = RFE(model, 10)
fit = rfe.fit(HRData[X], HRData[y])

其中 y 包含 1 和 0,而 X 具有 int 或 float 数据。

当我尝试用 RFE 拟合模型时,我不断得到这个:

/anaconda3/lib/python3.6/site-packages/pandas/core/frame.py in 
_getitem_frame(self, key)
   2033     def _getitem_frame(self, key):
   2034         if key.values.size and not is_bool_dtype(key.values):
-> 2035             raise ValueError('Must pass DataFrame with boolean values only')
   2036         return self.where(key)
   2037 

ValueError:必须仅通过布尔值传递 DataFrame

所以我不确定这个函数是否只接受带有布尔值的数据帧,因为我已经看到了带有连续变量的例子。

在此先感谢您的帮助!

4

0 回答 0