15

LAPACK 中是否有一个函数,它将为我提供特定子矩阵的元素?如果是这样,C++ 中的语法是什么?

还是我需要编码?

4

1 回答 1

26

没有访问子矩阵的功能。但是,由于矩阵数据存储在 LAPACK 例程中的方式,您不需要一个。这节省了大量的复制,并且出于这个原因(部分)选择了数据布局:

回想一下 LAPACK 中的密集(即非带状、三角形、厄米特等)矩阵由四个值定义:

  • 指向矩阵左上角的指针
  • 矩阵中的行数
  • 矩阵中的列数
  • 矩阵的“领先维度”;通常这是内存中一行相邻元素之间的距离。

大多数时候,大多数人只使用等于行数的前导维度。3x3 矩阵通常存储如下:

a[0] a[3] a[6] 
a[1] a[4] a[7]
a[2] a[5] a[8]

假设我们想要一个 3x3 的子矩阵,它是一个具有前导维度的巨大矩阵lda。假设我们特别想要左上角位于 a(15,42) 的 3x3 子矩阵:

         .             .            .
         .             .            .
... a[15+42*lda] a[15+43*lda] a[15+44*lda] ...
... a[16+42*lda] a[16+43*lda] a[16+44*lda] ...
... a[17+42*lda] a[17+43*lda] a[17+44*lda] ...
         .             .            .
         .             .            .

我们可以将这个 3x3 矩阵复制到连续存储中,但是如果我们想将其作为输入(或输出)矩阵传递给 LAPACK 例程,则不需要;我们只需要适当地定义参数。我们称这个子矩阵b;然后我们定义:

// pointer to the top-left corner of b:
float *b = &a[15 + 42*lda];
// number of rows in b:
const int nb = 3;
// number of columns in b:
const int mb = 3;
// leading dimension of b:
const int ldb = lda;

唯一可能令人惊讶的是ldb; 通过使用lda“大矩阵”的值,我们可以在不复制的情况下寻址子矩阵,并就地对其进行操作。

但是 我撒了谎(有点)。有时您真的无法在适当的位置上操作子矩阵,并且确实需要复制它。我不想谈论这个,因为它很少见,你应该尽可能使用就地操作,但如果不告诉你这是可能的,我会感到很遗憾。例行公事:

SLACPY(UPLO,M,N,A,LDA,B,LDB)

将左上角为 且以前导维数存储的MxN矩阵复制到左上角为且以前导维数存储的x矩阵。该参数表示是复制上三角、下三角还是整个矩阵。ALDAMNBLDBUPLO

在我上面给出的示例中,您将像这样使用它(假设使用 clapack 绑定):

...
const int m = 3;
const int n = 3;
float b[9];
const int ldb = 3;
slacpy("A",  // anything except "U" or "L" means "copy everything"
       &m,   // number of rows to copy
       &n,   // number of columns to copy
       &a[15 + 42*lda], // pointer to top-left element to copy
       lda,  // leading dimension of a (something huge)
       b,    // pointer to top-left element of destination
       ldb); // leading dimension of b (== m, so storage is dense)
...
于 2011-02-17T16:43:26.197 回答