我拥有 Intel Parallel Studio 2016,但我发现编译器的速度太慢、不可靠并且实际上提供的代码比 Clang 更差,但 SVML 是一件很棒的事情,所以我尝试通过 Agner Fog 的 VectorClass(https:// www.agner.org/optimize/)。正弦和余弦之类的东西似乎有效,但 pow __svml_powf4没有。它基本上会产生一堆废话。__svml_powf8 是一样的...
使用这些运气好吗?调用约定可能有问题吗?(考虑到它有 2 个参数,而 sin/cos 只有一个)