我需要使用 SIMD/Intel SSE 优化我的矩阵乘法。给出的示例代码如下所示:
*x = (float*)memalign(16, size * sizeof(float));
但是,我使用的是 C++,[found that][1]
而不是malloc
(在执行 SIMD 之前),我应该使用new
. 现在,我正在通过 SIMD/SSE 进一步优化,所以我需要对齐内存,所以问题是:我需要memalign
/_aligned_malloc
或者我的数组声明为
static float m1[SIZE][SIZE];
已经对齐了?(SIZE
是一个整数)