0

我有一个 __m512d 内在向量,我需要他的元素的总和。有什么简单的方法可以做到这一点?我专注于计算性能,所以我需要快速执行此操作。我对内在的了解不足以自己做,所以我需要你的帮助。

谢谢 :)

4

1 回答 1

2

我想以下内在应该对您有所帮助:

double _mm512_reduce_add_pd (__m512d a)

PS您可以自己在指南中寻找有用的内在函数。

于 2015-11-26T18:26:03.820 回答