我有一个这样的数组:
X = [0,0,1,1,0,0,1,1,1,0,0,0]
我想创建一个 nx2 的 one-hot 编码器向量
one_hotX = [[1,0],[1,0],[0,1],[0,1],[1,0]...]
是否有捷径可寻?OneHotEncoder 和 LabelEncoder 似乎不起作用。
我有一个这样的数组:
X = [0,0,1,1,0,0,1,1,1,0,0,0]
我想创建一个 nx2 的 one-hot 编码器向量
one_hotX = [[1,0],[1,0],[0,1],[0,1],[1,0]...]
是否有捷径可寻?OneHotEncoder 和 LabelEncoder 似乎不起作用。
自己构建向量怎么样:
[[0, 1] if i else [1, 0] for i in X]
#[[1, 0],
# [1, 0],
# [0, 1],
# [0, 1],
# [1, 0],
# [1, 0],
# [0, 1],
# [0, 1],
# [0, 1],
# [1, 0],
# [1, 0],
# [1, 0]]
如果您正在使用numpy
,您也可以执行以下操作(矢量化方法):
import numpy as np
code = np.array([[1,0],[0,1]])
arrX = np.array(X)
code[arrX]
#array([[1, 0],
# [1, 0],
# [0, 1],
# [0, 1],
# [1, 0],
# [1, 0],
# [0, 1],
# [0, 1],
# [0, 1],
# [1, 0],
# [1, 0],
# [1, 0]])