1

考虑以下 3 个数组:

np.random.seed(0)

X = np.random.randint(10, size=(4,5))
W = np.random.randint(10, size=(3,4))
y = np.random.randint(3, size=(5,1))

我想将矩阵 X 的每一列添加和求和到 W 的行,由 y 作为索引给出。因此,例如,如果 y 中的第一个元素是 3 ,我会将 X 的第一列添加到 W 的第四行(python 中的索引 3)并求和。我会一遍又一遍地做,直到 X 的所有列都添加到 W 的特定行并求和。我可以用不同的方式做到这一点:1-使用for循环:

for i,j in enumerate(y):
    W[j]+=X[:,i] 

2-使用 add.at 功能

np.add.at(W,(y.ravel()),X.T)

3-但我不明白如何使用 einsum 来做到这一点。我得到了一个解决方案,但真的无法理解。

N = y.max()+1
W[:N] += np.einsum('ijk,lk->il',(np.arange(N)[:,None,None] == y.ravel()),X) 

任何人都可以解释我这个结构吗?1 - (np.arange(N)[:,None,None] == y.ravel(),X)。我想这部分是指根据 y 将 X 的列与 W 的特定行相加。但是 W 在哪里?在这种情况下,为什么我们必须将 W 转换为 4 维?2- 'ijk,lk->il' - 我也不明白这一点。

i - 指行,j - 列,k- 每个元素,l - 'l' 也指什么?如果有人能理解这一点并向我解释,我将不胜感激。提前致谢。

4

1 回答 1

2

让我们通过删除一维并使用易于手动验证的值来简化问题:

W = np.zeros(3, np.int)
y = np.array([0, 1, 1, 2, 2])
X = np.array([1, 2, 3, 4, 5])

向量中的值通过查找来W获得附加值:Xy

for i, j in enumerate(y):
    W[j] += X[i]

W计算为[1, 5, 9],(手动快速检查)。

现在,如何对这段代码进行矢量化?我们不能做一个简单W[y] += X[y]的,因为y其中有重复的值,并且不同的总和会在索引 1 和 2 处相互覆盖。

可以做的是将这些值广播到一个新的维度,len(y)然后在这个新创建的维度上求和。

N = W.shape[0]
select = (np.arange(N) == y[:, None]).astype(np.int)

W取( )的索引范围[0, 1, 2],并将它们匹配的值设置y为新维度中的 1,否则为 0。select包含此数组:

array([[1, 0, 0],
       [0, 1, 0],
       [0, 1, 0],
       [0, 0, 1],
       [0, 0, 1]])

它有len(y) == len(X)行和len(W)列,并为每个 y/row 显示W它的索引。

让我们将 X 与这个数组相乘mult = select * X[:, None]

array([[1, 0, 0],
       [0, 2, 0],
       [0, 3, 0],
       [0, 0, 4],
       [0, 0, 5]])

我们已经有效地将 X 展开到一个新的维度,并以一种我们可以通过对新创建的维度求和的方式将其排序为 W 形状。行的总和是我们要添加到的向量W

sum_Xy = np.sum(mult, axis=0)  # [1, 5, 9]
W += sum_Xy

select和的计算mult可以与 结合np.einsum

# `select` has shape (len(y)==len(X), len(W)), or `yw`
# `X` has shape len(X)==len(y), or `y`
# we want something `len(W)`, or `w`, and to reduce the other dimension
sum_Xy = np.einsum("yw,y->w", select, X)

这就是一维示例。对于问题中提出的二维问题,方法完全相同:引入一个附加维度,广播y索引,然后用 减少附加维度einsum

如果您将一维示例的每个步骤内部化,我相信您可以弄清楚代码是如何在二维中执行的,因为这只是让索引正确的问题(W 行,X 列) .

于 2018-10-10T14:51:50.587 回答