我希望广播加载一个__m256
具有相同 4 对在内存中相邻的浮点数的向量。
也就是说,如果我有一些指向x
由 给出的浮点数组的指针{a, b}
,我希望以__mm256
包含的结尾{a, b, a, b, a, b, a, b}
。
我的问题是,在转换为双数组后是否有任何潜在的问题可以_mm256_broadcast_sd
用来实现这一点?x
所以:
__m256 vect = (__m256)_mm256_broadcast_sd((double *)x);
我希望广播加载一个__m256
具有相同 4 对在内存中相邻的浮点数的向量。
也就是说,如果我有一些指向x
由 给出的浮点数组的指针{a, b}
,我希望以__mm256
包含的结尾{a, b, a, b, a, b, a, b}
。
我的问题是,在转换为双数组后是否有任何潜在的问题可以_mm256_broadcast_sd
用来实现这一点?x
所以:
__m256 vect = (__m256)_mm256_broadcast_sd((double *)x);