4

我有一个带有 ID 变量和另一个分类变量的 DataFrame。我想用 get_dummies 从分类变量中创建虚拟变量。

dum = pd.get_dummies(df)

但是,这会使 ID 变量消失。我稍后需要这个 ID 变量来合并到其他数据集。

有没有办法保留其他变量。在 get_dummies 的文档中,我找不到任何东西。谢谢!

4

2 回答 2

8

您还可以在执行 get_dummies 之前将原始列复制到新列中。例如,

df['dum_orig'] = df['dum']
df = pd.get_dummies(df, columns=['dum'])
于 2018-11-12T00:23:20.807 回答
4

我找到了答案。您可以将虚拟数据集连接到原始数据集,如下所示。只要您在此期间不重新排序数据。

df = pd.concat([df, dum], axis=1) 
于 2016-07-23T12:16:06.850 回答