我正在尝试使用 cblas_dgemm 对 1 x N 和 N x N 矩阵执行矩阵乘法。我的电话如下:
cblas_dgemm(CblasRowMajor, CblasNoTrans, CblasNoTrans,
1, width, width, 1.0, A, width, B, width,
0.0, C, width);
但是我在 C 中得到的只是 A 的副本。
以下是该方法的文档:https ://software.intel.com/en-us/node/429920
我已经多次检查了这些参数,它们看起来都很好,所以我想知道是否有人能指出我在做什么愚蠢的事情?