从一个数组db
(大约是(1e6, 300)
)和一个mask = [1, 0, 1]
向量中,我将目标定义为第一列中的 1。
我想创建一个out
向量,该向量由其中对应的行db
匹配mask
andtarget==1
和其他任何地方的零组成。
db = np.array([ # out for mask = [1, 0, 1]
# target, vector #
[1, 1, 0, 1], # 1
[0, 1, 1, 1], # 0 (fit to mask but target == 0)
[0, 0, 1, 0], # 0
[1, 1, 0, 1], # 1
[0, 1, 1, 0], # 0
[1, 0, 0, 0], # 0
])
我已经定义了一个vline
函数,该函数将 amask
应用于每个数组行,np.array_equal(mask, mask & vector)
用于检查向量 101 和 111 是否适合掩码,然后仅保留索引 where target == 1
。
out
被初始化为array([0, 0, 0, 0, 0, 0])
out = [0, 0, 0, 0, 0, 0]
vline
函数定义为:
def vline(idx, mask):
line = db[idx]
target, vector = line[0], line[1:]
if np.array_equal(mask, mask & vector):
if target == 1:
out[idx] = 1
for
通过在循环中逐行应用此函数,我得到了正确的结果:
def check_mask(db, out, mask=[1, 0, 1]):
# idx_db to iterate over db lines without enumerate
for idx in np.arange(db.shape[0]):
vline(idx, mask=mask)
return out
assert check_mask(db, out, [1, 0, 1]) == [1, 0, 0, 1, 0, 0] # it works !
现在我想vline
通过创建一个矢量化ufunc
:
ufunc_vline = np.frompyfunc(vline, 2, 1)
out = [0, 0, 0, 0, 0, 0]
ufunc_vline(db, [1, 0, 1])
print out
但是ufunc
抱怨用这些形状广播输入:
In [217]: ufunc_vline(db, [1, 0, 1])
---------------------------------------------------------------------------
ValueError Traceback (most recent call last)
<ipython-input-217-9008ebeb6aa1> in <module>()
----> 1 ufunc_vline(db, [1, 0, 1])
ValueError: operands could not be broadcast together with shapes (6,4) (3,)
In [218]: