1

我正在开发一个依赖张量收缩的 C++ 库。我不会在此处发布完整的应用程序,但我已将其提炼为以下内容。

我们定义了一个玩具 rank-4 张量,它只不过是 (0, 1, ..., 15) 重新整形:

Eigen::Tensor<double, 4> T (2, 2, 2, 2);
for (size_t i = 0; i < 2; i++) {
    for (size_t j = 0; j < 2; j++) {
        for (size_t k = 0; k < 2; k++) {
            for (size_t l = 0; l < 2; l++) {
                T(i, j, k, l) = l + 2 * k + 4 * j + 8 * i;
            }
        }
    }
}

以及要与之收缩的 rank-2 张量,它只不过是 (1, 2, 3, 4) 重塑:

Eigen::Tensor<double, 2> A (2, 2);
for (size_t i = 0; i < 2; i++) {
    for (size_t j = 0; j < 2; j++) {
        A(i, j) = 1 + j + 2 * i;
    }
}

要在 Eigen 中收缩两个张量,我们必须指定一个收缩对。我们的目标是收缩张量的前两个指数,如T(ijkl)*A(ib)=M(bjkl). 以我目前对 Eigen 中张量模块的理解,我们将收缩对写为

Eigen::array<Eigen::IndexPair<int>, 1> contraction_pair = {Eigen::IndexPair<int>(0, 0)};

但是,我认为应该可以使用完全相同的收缩对来执行收缩A(ib)*T(ijkl)=N(bjkl)。不幸的是,情况并非如此,并且元素M

0 0 0 0  24
0 0 0 1  32
0 0 1 0  28
0 0 1 1  38
0 1 0 0  32
0 1 0 1  44
0 1 1 0  36
0 1 1 1  50
1 0 0 0  40
1 0 0 1  56
1 0 1 0  44
1 0 1 1  62
1 1 0 0  48
1 1 0 1  68
1 1 1 0  52
1 1 1 1  74

而这些N

0 0 0 0  24
0 0 0 1  28
0 0 1 0  32
0 0 1 1  36
0 1 0 0  40
0 1 0 1  44
0 1 1 0  48
0 1 1 1  52
1 0 0 0  32
1 0 0 1  38
1 0 1 0  44
1 0 1 1  50
1 1 0 0  56
1 1 0 1  62
1 1 1 0  68
1 1 1 1  74

我使用 einsum 在 numpy 中测试了相同的玩具张量:

T = np.arange(16).reshape(2, 2, 2, 2)
A = np.arange(1, 5).reshape(2, 2)

contraction1 = np.einsum('ijkl,ia->ajkl', integrals, C)
contraction2 = np.einsum('ia,ijkl->ajkl', C, integrals)

并且contraction1两者contraction2都是

0   0   0   0   24
0   0   0   1   28
0   0   1   0   32
0   0   1   1   36
0   1   0   0   40
0   1   0   1   44
0   1   1   0   48
0   1   1   1   52
1   0   0   0   32
1   0   0   1   38
1   0   1   0   44
1   0   1   1   50
1   1   0   0   56
1   1   0   1   62
1   1   1   0   68
1   1   1   1   74

这与A(ib)*T(ijkl)=N(bjkl)Eigen 中的情况一致。是什么导致 Eigen 在两种情况下都没有给出相同的结果?

4

1 回答 1

1

Eigen界面似乎仅采用收缩轴进行规范。因此,它必须自行决定如何安排非收缩轴。显而易见的方法是保持原始轴的顺序,首先是第一个参数,然后是第二个。

为了确认这一点,我们可以

  • 使用np.einsum指定不同的输出布局并与以下输出进行比较Eigen

.

import numpy as np

T = np.arange(16).reshape(2, 2, 2, 2)
A = np.arange(1, 5).reshape(2, 2)

print(np.einsum('ijkl,ia->ajkl', T, A))
# [[[[24 28]
#    [32 36]]

#   [[40 44]
#    [48 52]]]


#  [[[32 38]
#    [44 50]]

#   [[56 62]
#    [68 74]]]]

print(np.einsum('ijkl,ia->jkla', T, A))
# [[[[24 32]
#    [28 38]]

#   [[32 44]
#    [36 50]]]


#  [[[40 56]
#    [44 62]]

#   [[48 68]
#    [52 74]]]]
  • 或直接洗牌Eigen(感谢@lelemmen):

.

M.shuffle(Eigen::array<int, 4> {3, 0, 1, 2})
(M_shuffled == N).all()

# 1
于 2017-11-29T17:23:18.407 回答