4

我以前使用 SIMD 运算符来提高我的代码效率,但是我现在面临一个我无法解决的新错误。对于这项任务,速度至关重要。

在导入数据之前,数组的大小是未知的,可能非常小(100 个值)或巨大(1000 万个值)。对于后一种情况,代码可以正常工作,但是当我使用少于 130036 个数组值时遇到错误。

有谁知道是什么导致了这个问题以及如何解决它?

我附上了所涉及的(经过测试的)代码,稍后将在更复杂的功能中使用。错误发生在“arg1List[i] = ...”

#include <iostream>
#include <xmmintrin.h>
#include <emmintrin.h>

void main()
{
    int j;
    const int loop = 130036;
    const int SIMDloop = (int)(loop/4);
    __m128 *arg1List = new __m128[SIMDloop];

    printf("sizeof(arg1List)= %d, alignof(Arg1List)= %d, pointer= %p", sizeof(arg1List), __alignof(arg1List), arg1List);
    std::cout << std::endl;

    for (int i = 0; i < SIMDloop; i++)
    {
        j = 4*i;
        arg1List[i] = _mm_set_ps((j+1)/100.0f, (j+2)/100.0f, (j+3)/100.0f, (j+4)/100.0f);
    }
}
4

1 回答 1

10

对齐是原因。

MOVAPS——移动对齐的压缩单精度浮点值

[...] 操作数必须在 16 字节边界上对齐,否则将生成通用保护异常 (#GP)。

对齐指针后,您可以看到问题消失了:

__m128 *arg1List = new __m128[SIMDloop + 1];
arg1List = (__m128*) (((int) arg1List + 15) & ~15);
于 2012-10-22T14:56:59.760 回答