我只是研究TensorFlow。并对 tensordot 感到困惑。例如,我的代码是:
import tensorflow as tf
a=tf.Variable([[1,2],[4,5],[7,8]])
b=tf.Variable([[1,2],[4,5],[7,8]])
基于 tf.tensordot 中不同的轴参数,结果是不同的。
tf.tensordot(a,b,axes=0)
<tf.Tensor: shape=(3, 2, 3, 2), dtype=int32, numpy=
array([[[[ 1, 2],
[ 4, 5],
[ 7, 8]],
[[ 2, 4],
[ 8, 10],
[14, 16]]],
[[[ 4, 8],
[16, 20],
[28, 32]],
[[ 5, 10],
[20, 25],
[35, 40]]],
[[[ 7, 14],
[28, 35],
[49, 56]],
[[ 8, 16],
[32, 40],
[56, 64]]]], dtype=int32)>
tf.tensordot(a,b,axes=0)
InvalidArgumentError: Matrix size-incompatible: In[0]: [3,2], In[1]: [3,2] [Op:MatMul]
tf.tensordot(a,b,axes=2)
<tf.Tensor: shape=(), dtype=int32, numpy=159>
虽然看了一些解释,但还是没看懂。它是如何工作的?