我尝试使用 SSE 进行 4 像素操作。我在将图像数据加载到 __m128 时遇到问题。我的图像数据是一个字符缓冲区。假设我的图像是 1024 x1024。我的过滤器是 16x16。
__m128 IMG_VALUES, FIL_VALUES, NEW_VALUES;
//ok:
IMG_VALUES=_mm_load_ps(&pInput[0]);
//hang below:
IMG_VALUES=_mm_load_ps(&pInput[1]);
我不知道如何处理索引 1,2,3 ...谢谢。