假设我有一个整数向量,其中每个整数对应一个类别:
A = [1, 2, 2, 3, 3, 1, 2, 4, 4, 1]
我知道我有多少类别。这个向量是我的 X 数据集的列之一,它将以逻辑回归模型结束。
是否可以使用 sciki-tlearn 函数onehotencoder来获得类似的东西:
0 0 0 1(当 1)
0 0 1 0(当 2)
0 1 0 0(当 3)
1 0 0 0(当任何时候)
甚至更好
0 0 0
0 0 1
0 1 0
1 0 0
?
当我尝试将这样的向量传递给 onehotencoder 时,我收到此错误:need more than 1 value to unpack
.
此外:我想如果我有“NULL”记录,我应该首先将它们转换为一个数字:有没有一种快速的方法来做到这一点,比如A(find(A=='NULL'))=123
?
谢谢您的帮助。弗朗切斯科