0

代码如下。我想从标签编码代码中排除两列名称“卡类型”和“风险值”。如何排除那些?下面的代码将所有对象类型编码为数字。 列是警报编号 Job、Loan、City、Date、Card Type、Gender、Income level、EstimatedSalary、Risk Value

le = LabelEncoder()
objList = bank_dataset.select_dtypes(include="object").columns

for feat in objList:
    bank_dataset[feat] = le.fit_transform(bank_dataset[feat].astype(str))
4

2 回答 2

0

采用:

objList = bank_dataset.select_dtypes(include="object").columns

objList = objList.difference(['Card Type','Risk Value'], sort=False)

或者:

objList = [x for x in objList if x not in ['Card Type','Risk Value']]
于 2021-01-25T09:22:20.227 回答
0

默认情况下,每个数据集操作都不会就地完成,我会像这样简单地使用 drop 函数:

objList = bank_dataset.drop(columns=['Card Type','Risk Value']).select_dtypes(include="object").columns
于 2021-01-25T09:26:32.650 回答