LAPACK 中是否有一个函数,它将为我提供特定子矩阵的元素?如果是这样,C++ 中的语法是什么?
还是我需要编码?
没有访问子矩阵的功能。但是,由于矩阵数据存储在 LAPACK 例程中的方式,您不需要一个。这节省了大量的复制,并且出于这个原因(部分)选择了数据布局:
回想一下 LAPACK 中的密集(即非带状、三角形、厄米特等)矩阵由四个值定义:
大多数时候,大多数人只使用等于行数的前导维度。3x3 矩阵通常存储如下:
a[0] a[3] a[6]
a[1] a[4] a[7]
a[2] a[5] a[8]
假设我们想要一个 3x3 的子矩阵,它是一个具有前导维度的巨大矩阵lda
。假设我们特别想要左上角位于 a(15,42) 的 3x3 子矩阵:
. . .
. . .
... a[15+42*lda] a[15+43*lda] a[15+44*lda] ...
... a[16+42*lda] a[16+43*lda] a[16+44*lda] ...
... a[17+42*lda] a[17+43*lda] a[17+44*lda] ...
. . .
. . .
我们可以将这个 3x3 矩阵复制到连续存储中,但是如果我们想将其作为输入(或输出)矩阵传递给 LAPACK 例程,则不需要;我们只需要适当地定义参数。我们称这个子矩阵b
;然后我们定义:
// pointer to the top-left corner of b:
float *b = &a[15 + 42*lda];
// number of rows in b:
const int nb = 3;
// number of columns in b:
const int mb = 3;
// leading dimension of b:
const int ldb = lda;
唯一可能令人惊讶的是ldb
; 通过使用lda
“大矩阵”的值,我们可以在不复制的情况下寻址子矩阵,并就地对其进行操作。
但是 我撒了谎(有点)。有时您真的无法在适当的位置上操作子矩阵,并且确实需要复制它。我不想谈论这个,因为它很少见,你应该尽可能使用就地操作,但如果不告诉你这是可能的,我会感到很遗憾。例行公事:
SLACPY(UPLO,M,N,A,LDA,B,LDB)
将左上角为 且以前导维数存储的M
xN
矩阵复制到左上角为且以前导维数存储的x矩阵。该参数表示是复制上三角、下三角还是整个矩阵。A
LDA
M
N
B
LDB
UPLO
在我上面给出的示例中,您将像这样使用它(假设使用 clapack 绑定):
...
const int m = 3;
const int n = 3;
float b[9];
const int ldb = 3;
slacpy("A", // anything except "U" or "L" means "copy everything"
&m, // number of rows to copy
&n, // number of columns to copy
&a[15 + 42*lda], // pointer to top-left element to copy
lda, // leading dimension of a (something huge)
b, // pointer to top-left element of destination
ldb); // leading dimension of b (== m, so storage is dense)
...