例如,cublas<t>geam()
将做:
但是如果我想存储结果A
呢?我可以用指针调用它,*C = *A
以便:
不用担心我可能会将输出写入仍然作为输入读取的矩阵?
如果是这样,是否保证我们可以安全地使用所有其他 CUBLAS 矩阵运算?
例如,cublas<t>geam()
将做:
但是如果我想存储结果A
呢?我可以用指针调用它,*C = *A
以便:
不用担心我可能会将输出写入仍然作为输入读取的矩阵?
如果是这样,是否保证我们可以安全地使用所有其他 CUBLAS 矩阵运算?
正如您发布的那样,cublas 文档中的答案很好 - cublasgeam() - If C overlaps A or B, then behaviour is undefined
。Nvidia 不保证这会奏效,如果C == A
.