0

我为要用于线性回归模型的数据生成了以下虚拟变量。

虚拟变量

data = df.copy() #make a copy of our cleaned dataset called data
X = data[['age', 'blood_pressure', 'specific_gravity', 'albumin', 'sugar',
       'pus_cell', 'pus_cell_clumps', 'bacteria', 'blood_glucose_random',
       'blood_urea', 'serum_creatinine', 'sodium', 'potassium', 'hemoglobin',
       'packed_cell_volume', 'white_blood_cell_count', 'red_blood_cell_count',
       'hypertension', 'diabetes_mellitus', 'coronary_artery_disease',
       'appetite', 'pedal_edema', 'anemia','classification'
       ]]
#convert all object/category columns into dummy/indicator variables.
X = pd.get_dummies(data= X, drop_first=True)
X.head()

我希望分类列虚拟变量是classification_ckd

我怎样才能做到这一点?

4

1 回答 1

0

您需要使用这样的前缀pd.get_dummies(df, prefix=['col1', 'col2'])。从此文档中阅读更多详细信息Pandas-doc

于 2022-02-22T06:24:41.163 回答