我想使用 AVX 将 4 个压缩的 64 位整数转换为 4 个压缩的 64 位浮点数。我试过类似的东西:
int_64t *ls = (int64_t *) _mm_malloc(256, 32);
ls[0] = a;
//...
ls[3] = d;
__mm256i packed = _mm256_load_si256((__m256i const *)ls);
这将显示在调试器中:
(gdb) print packed
$4 = {1234, 5678, 9012, 3456}
到目前为止还可以,但我能找到的唯一转换/转换操作是 _mm256i_castsi256_pd,它没有得到我想要的:
__m256d pd = _mm256_castsi256_pd(packed);
(gdb) print pd
$5 = {6.0967700696809824e-321, 2.8053047370865979e-320, 4.4525196003213139e-320, 1.7074908720273481e-320}
我真正想看到的是:
(gdb) print pd
$5 = {1234.0, 5678.0, 9012.0, 3456.0}