根据文档:
对于 N 维,是 的最后一个轴和 的倒数第二个
dot
轴的和积:a
b
dot(a, b)[i,j,k,m] = sum(a[i,j,:] * b[k,:,m])
我想计算最后一个轴a
和倒数第二个轴上的和积,b
但没有在其余轴上形成笛卡尔积,因为其余轴具有相同的形状。让我用一个例子来说明:
a = np.random.normal(size=(11, 12, 13))
b = np.random.normal(size=(11, 12, 13, 13))
c = np.dot(a, b)
c.shape # = (11, 12, 11, 12, 13)
但我希望形状是(11, 12, 13)
. 使用广播可以达到预期的效果
c = np.sum(a[..., None] * b, axis=-2)
c.shape # = (11, 12, 13)
但是我的数组相对较大,我想使用并行化 BLAS 实现的强大功能,这些实现似乎np.sum
不受np.dot
. 关于如何实现这一目标的任何想法?