1

我有一个这样的数组:

X = [0,0,1,1,0,0,1,1,1,0,0,0]

我想创建一个 nx2 的 one-hot 编码器向量

one_hotX = [[1,0],[1,0],[0,1],[0,1],[1,0]...]

是否有捷径可寻?OneHotEncoder 和 LabelEncoder 似乎不起作用。

4

1 回答 1

3

自己构建向量怎么样:

[[0, 1] if i else [1, 0] for i in X]

#[[1, 0],
# [1, 0],
# [0, 1],
# [0, 1],
# [1, 0],
# [1, 0],
# [0, 1],
# [0, 1],
# [0, 1],
# [1, 0],
# [1, 0],
# [1, 0]]

如果您正在使用numpy,您也可以执行以下操作(矢量化方法):

import numpy as np
code = np.array([[1,0],[0,1]])
arrX = np.array(X)

code[arrX]

#array([[1, 0],
#       [1, 0],
#       [0, 1],
#       [0, 1],
#       [1, 0],
#       [1, 0],
#       [0, 1],
#       [0, 1],
#       [0, 1],
#       [1, 0],
#       [1, 0],
#       [1, 0]])
于 2016-12-09T23:20:18.050 回答