2

tensordotNumPy和函数之间的异同einsum有据可查,并在本论坛中进行了广泛讨论(例如[1][2][3][4][5])。但是,我遇到了一个使用矩阵乘法的实例einsum,我发现使用它进行复制非常困难,如果不是不可能的话tensordot:如果我们的两个数组是,

>>> A = np.array([[0, 1], [1, 0]])
>>> B = np.arange(2 ** 4).reshape((2, 2, 2, 2))

是否存在tensordot与以下内容等效的一行?

>>> np.einsum("ab,ibjk->iajk", A, B)
array([[[[ 4,  5],
         [ 6,  7]],

        [[ 0,  1],
         [ 2,  3]]],


       [[[12, 13],
         [14, 15]],

        [[ 8,  9],
         [10, 11]]]]) 

根据我的发现,答案似乎是“不”。问题出现在输出维度的索引中iajk。在这里,aarrayA的维度出现在维度ijarray之间B。如果输出维度的索引改为aijknp.tensordot(A, B, (1, 1))则可以正常工作。为了确定,我使用所有可能的轴进行了测试,

>>> output_einsum = np.einsum("ab,ibjk->iajk", A, B)
>>> axes_A = [-2, -1, 0, 1]
>>> axes_B = [-4, -3, -2, -1, 0, 1, 2, 3]
>>> for i in axes_A:
...     for j in axes_B:
...         output_tensordot = np.tensordot(A, B, axes=(i, j))
...         if np.allclose(ouput_einsum, output_tensordot):
...             print(i,j)
...

并发现没有任何允许的轴组合产生预期的结果。请注意,B将参数的每个元素的尺寸限制axes为长度为 1。einsum使用交错输出维度的函数不能在一行中重现是否正确tensordot?如果是这样,是否存在多行解决方法?

4

1 回答 1

1

正如我在之前的回答中所强调的,tensordot是 的扩展np.dot,允许我们指定在乘积和中使用哪些维度。默认是 A的dot最后一个,B 的第二个到最后一个。

这说明了如何dot处理大于 2 的尺寸:

In [158]: np.dot(np.ones((2,3,4)),np.ones((5,4,7))).shape
Out[158]: (2, 3, 5, 7)

顺便说一句tensordot, 的非收缩维度B遵循 的那些A。因此,采用相同的数组,但移动轴,会产生相同的结果。

In [162]: np.tensordot(np.ones((2,4,3)),np.ones((5,7,4)),(1,2)).shape 
Out[162]: (2, 3, 5, 7)

在这些示例中,我选择了不同的维度,因此顺序更加明显。

tensordot不提供对非收缩维度重新排序的方法。但是之后你可以很容易地做到这一点。

您的示例周围有 2 个尺寸。这允许您指定轴的任意组合,但需要使用allclose来测试结果。

In [146]: >>> A = np.array([[0, 1], [1, 0]])
     ...: >>> B = np.arange(2 ** 4).reshape((2, 2, 2, 2))

在两个数组的第二轴上执行乘积之和:

In [147]: C=np.tensordot(A,B,(1,1))
In [148]: C.shape
Out[148]: (2, 2, 2, 2)
In [149]: C
Out[149]: 
array([[[[ 4,  5],
         [ 6,  7]],

        [[12, 13],
         [14, 15]]],


       [[[ 0,  1],
         [ 2,  3]],

        [[ 8,  9],
         [10, 11]]]])

以及einsum它的默认结果排序('aijk')

In [150]: D= np.einsum('ab,ibjk',A,B)
In [151]: np.allclose(C,D)
Out[151]: True

tensordot相当于这个dot

In [152]: E = np.dot(A,B.reshape(2,2,4))
In [153]: E.shape
Out[153]: (2, 2, 4)
In [154]: np.allclose(C,E.reshape(2,2,2,2))
Out[154]: True
In [155]: np.allclose(E,np.einsum('ab,ibk',A,B.reshape(2,2,4)))
Out[155]: True
于 2021-05-01T16:02:27.710 回答