1

我正在尝试预测一个数据集,该数据集有一列包含不同的字符串。例如,有 3 个品牌,“A”、“B”和“C”,我想用数字(例如 0、1 和 2)替换它们。

如果只有 2 个品牌,我知道该怎么做,使用pd.eq,

我曾尝试使用set,但我想知道是否有更简单的方法可以做到这一点,因为我必须用具有超过 5 个不同字符串的列替换它,这会很烦人。

4

2 回答 2

1

您可以通过选择与这些条件匹配的记录来替换它们,假设您有数据df并且感兴趣的列是'Brand'

replacement = { 'A': 0, 'B': 1, 'C': 2 }
for key, value in replacement.items():
    df.loc[df['Brand'] == key, 'Brand'] = value
于 2021-06-21T00:08:33.570 回答
1
df['Brand'].map({'A': 0, 'B':1,'C': 2})
于 2021-06-21T00:14:39.307 回答