1

我正在使用来自sklearn. 到目前为止,这是我的代码:

iris = datasets.load_iris()

data = pd.DataFrame(iris['data'])
target = pd.DataFrame(iris['target'])

frames = [data,target]
iris = pd.concat(frames,axis=1)

iris.columns = ['sepal_length','sepal_width','petal_length','petal_width','species']

def convert_target(data):
    if data == 0:
        return 'setosa'
    elif data == 1:
        return 'versicolor'
    else:
        return 'virginica'
iris['species'] = iris['species'].apply(convert_target)

观察我如何使用convert_target函数将物种从数值转换为分类值。我的问题是,有没有更好、更有效的方法来做到这一点?

4

2 回答 2

1

你可以这样做map

d = {0: 'setosa', 1: 'versicolor', 2: 'virginica'}
iris['species'] = iris['species'].map(d)

您还可以使用 numpy 索引:

cat_names = np.array(['setosa', 'versicolor', 'virginica'])
iris['species'] = cat_names[iris['species']]
于 2021-03-25T14:51:16.700 回答
1

代替map,您可以使用replace字典:

iris['species'] = iris['species'].replace({0:'setosa',1:'versicolor',2:'virginica'})
iris.samle(5)

     sepal_length  sepal_width  petal_length  petal_width     species
3             4.6          3.1           1.5          0.2      setosa
73            6.1          2.8           4.7          1.2  versicolor
138           6.0          3.0           4.8          1.8   virginica
6             4.6          3.4           1.4          0.3      setosa
140           6.7          3.1           5.6          2.4   virginica
于 2021-03-25T15:07:30.307 回答