dfcars= pd.read_excel('cars.xlsx')
ohe=OneHotEncoder()
temp1= pd.DataFrame(ohe.fit_transform(dfcars[['Car Model']]).toarray())
ohe.categories_
dfcars = pd.concat([dfcars,temp1], axis=1)
虽然dfcars
已与 连接temp
,但dfcars[0]
返回第 4 列并dfcars[4]
显示错误。
为什么会这样?
另外,我到处搜索,但找不到如何使用categories_
,OneHotEncoder
所以请告诉它的作用以及使用的正确语法。
我试过了,但可能由于上述问题,起始列消失了,所有值都用 NaN 填充。
df_drop=dfcars.drop(['Car Model'],axis=1)
df_drop = pd.DataFrame(data= df_drop, columns= ohe.categories_)