1million X 1000
我有一个维度的熊猫数据框。列是分类变量。我想对它们进行编码。
我已经从 sklearn 获得了编码模型并对其进行了安装。现在想并行转换我的数据框的列。
transformed_X = encoding_model.transform(X)
上面的 X 是我要编码的数据帧。这里是以串行方式进行的。有没有办法将转换函数并行应用于我的数据框 X 的每一列?
1million X 1000
我有一个维度的熊猫数据框。列是分类变量。我想对它们进行编码。
我已经从 sklearn 获得了编码模型并对其进行了安装。现在想并行转换我的数据框的列。
transformed_X = encoding_model.transform(X)
上面的 X 是我要编码的数据帧。这里是以串行方式进行的。有没有办法将转换函数并行应用于我的数据框 X 的每一列?
如果您尝试对分类变量进行 1 次热编码,则可以使用pd.get_dummies()函数
df = pd.get_dummies(df)