如何计算 ndarray 中每个数据点的元素数?
我想要做的是对我的 ndarray 中至少存在 N 次的所有值运行 OneHotEncoder。
我还想用另一个没有出现在数组中的元素替换所有出现少于 N 次的值(我们称之为 new_value)。
所以例如我有:
import numpy as np
a = np.array([[[2], [2,3], [3,34]],
[[3], [4,5], [3,34]],
[[3], [2,3], [3,4] ]]])
阈值 N=2 我想要类似的东西:
b = [OneHotEncoder(a[:,[i]])[0] if count(a[:,[i]])>2
else OneHotEncoder(new_value) for i in range(a.shape(1)]
所以只是为了理解我想要的替换,不考虑 onehotencoder 并使用 new_value=10 我的数组应该如下所示:
a = np.array([[[10], [2,3], [3,34]],
[[3], [10], [3,34]],
[[3], [2,3], [10] ]]])