我正在使用 python(与 pandas 等)我有一个带有标签列的数据框(类 a、b、c 等 - 总共 38 个)。我想使用 Xgboost 进行预测,但它只适用于 0:num_classes 范围内的标签。
所以基本上我需要: - 用 0:num_class 索引替换标签列中的所有值(a 用 0,b 用 1,c 用 2 等)
类数为 38,因此无法手动映射和替换。有没有一种优雅的方式来做到这一点?(在 R 中我会使用:
train_data$Class <- as.numeric(factor(train_data$Class))
但它在这里不起作用。