1

我正在优化反向传播算法的实现以训练神经网络。我正在研究的一个方面是对一组数据点(输入/输出向量)执行矩阵运算,作为由 numpy 库优化的批处理,而不是循环遍历每个数据点。

在我原来的算法中,我做了以下事情:

for datapoint in datapoints:
  A = ... (created out of datapoint info)
  B = ... (created out of datapoint info)

  C = np.dot(A,B.transpose())
____________________

A: (7,1) numpy array
B: (6,1) numpy array
C: (7,6) numpy array

然后我将所述矩阵扩展为张量,其中第一个形状索引将引用数据集。如果我有 3 个数据集(为简单起见),矩阵将如下所示:

A: (3,7,1) numpy array
B: (3,6,1) numpy array
C: (3,7,6) numpy array

仅使用 np.tensordot 或其他 numpy 操作,如何生成 C?

我假设答案看起来像这样:

C = np.tensordot(A.[some manipulation], B.[some manipulation], axes = (...))

(这是一个更复杂的应用程序的一部分,我构建事物的方式不再灵活。如果我找不到解决方案,我只会遍历数据集并为每个数据集执行乘法)

4

1 回答 1

2

我们可以使用np.einsum-

c = np.einsum('ijk,ilm->ijl',a,b)

由于最后一个轴是单例的,因此使用切片数组可能会更好 -

c = np.einsum('ij,il->ijl',a[...,0],b[...,0])

np.matmul/@-operator-

c = a@b.swapaxes(1,2)
于 2020-06-12T18:01:58.177 回答