0

例如,cublas<t>geam()将做:

C = αop(A) + βop(B)

但是如果我想存储结果A我可以用指针调用它,*C = *A以便:

A = αop(A) + βop(B)

不用担心我可能会将输出写入仍然作为输入读取的矩阵?

如果是这样,是否保证我们可以安全地使用所有其他 CUBLAS 矩阵运算?

4

1 回答 1

3

正如您发布的那样,cublas 文档中的答案很好 - cublasgeam() - If C overlaps A or B, then behaviour is undefined。Nvidia 不保证这会奏效,如果C == A.

于 2013-05-02T04:21:45.027 回答