1

继续如何在sklearn中对连续属性进行离散化?

在我从训练数据中“学习”我的 bin 之后,np.histogram(A['my_var'])如何将它应用到我的测试集上?每个数据点的 my_var 属性在哪个 bin 中?如果重要的话,我的训练数据和测试数据都在 pandas 数据框中。

谢谢

4

1 回答 1

0

哎呀。这很简单。

hist = np.histogram(A['my_var'])
A.loc[:, 'my_bin'] = np.digitize(A['my_var'], hist[1])
于 2015-09-15T13:18:27.540 回答