27

我有一个由数据框加载的数据集,其中需要使用LabelEncoderscikit-learn 对类标签进行编码。该列label是具有以下类的类标签列:

[‘Standing’, ‘Walking’, ‘Running’, ‘null’]

为了执行标签编码,我尝试了以下方法,但它不起作用。我该如何解决?

from sklearn import preprocessing
import pandas as pd

df = pd.read_csv('dataset.csv', sep=',') 
df.apply(preprocessing.LabelEncoder().fit_transform(df['label']))
4

3 回答 3

49

您可以尝试如下:

le = preprocessing.LabelEncoder()
df['label'] = le.fit_transform(df.label.values)

或者以下也可以:

df['label'] = le.fit_transform(df['label'])

它将label用编码标签替换数据框中的原始值。

于 2018-05-09T17:39:34.120 回答
2

你也可以这样做:

from sklearn.preprocessing import LabelEncoder
le = LabelEncoder()
df.col_name= le.fit_transform(df.col_name.values)

其中 col_name = 要标记的特征编码

于 2020-04-27T14:05:18.223 回答
0
 from sklearn.preprocessing import LabelEncoder
 le = LabelEncoder()
 X[:, 2] = le.fit_transform(X[:, 2]) 

如果您想更改 CSV 数据中的特定列,这可能会有所帮助

于 2021-10-01T10:08:58.137 回答