python - 对平方数组求和

Question

作为批量欧几里得距离计算的一部分，我正在计算

(X * X).sum(axis=1)

是X一个相当大的二维数组。这很好用，但它构造了一个与X. 有什么办法可以摆脱这种暂时的，但保持矢量化操作的效率？

显而易见的候选人，

np.array([np.dot(row, row) for row in X])

有效，但使用 Python 列表作为临时列表，使其相当慢。

如果没有axis，内存有效的形式将是

(X * X).sum()  =>  np.dot(X.ravel(), X.ravel())

我知道，当时axis=1，它相当于

np.diag(np.dot(X, X.T))

这让我研究了dot诸如np.inner,np.tensordot和之类的概括np.einsum，但我不知道它们将如何解决我的问题。

score 11 · Accepted Answer

einsum等效的是：

np.einsum('ij,ij->i', X, X)

虽然我不确定这在内部是如何工作的，所以它可能会也可能不会解决您的问题。

1 回答 1