为了加快库中的计算速度,我决定使用std::valarray
该类。文档说:
std::valarray 和辅助类被定义为没有某些形式的别名,因此允许对这些类的操作进行优化,类似于 C 编程语言中关键字限制的效果。此外,允许接受 valarray 参数的函数和运算符返回代理对象,以使编译器可以优化表达式,例如 v1 = a * v2 + v3; 作为执行 v1[i] = a * v2[i] + v3[i] 的单个循环;避免任何临时或多次通行证。
这正是我所需要的。当我使用 g++ 编译器时,它按照文档中的描述工作。我开发了一个简单的示例来测试std::valarray
性能:
void check(std::valarray<float>& a)
{
for (int i = 0; i < a.size(); i++)
if (a[i] != 7)
std::cout << "Error" << std::endl;
}
int main()
{
const int N = 100000000;
std::valarray<float> a(1, N);
std::valarray<float> c(2, N);
std::valarray<float> b(3, N);
std::valarray<float> d(N);
auto start = std::chrono::system_clock::now();
d = a + b * c;
auto end = std::chrono::system_clock::now();
std::cout << "Valarr optimized case: "
<< (end - start).count() << std::endl;
check(d);
// Optimal single loop case
start = std::chrono::system_clock::now();
for (int i = 0; i < N; i++)
d[i] = a[i] + b[i] * c[i];
end = std::chrono::system_clock::now();
std::cout << "Optimal case: " << (end - start).count() << std::endl;
check(d);
return 0;
}
在 g++ 上,我得到:
Valarr optimized case: 1484215
Optimal case: 1472202
看起来所有的操作d = a + b * c;
真的都放在了一个循环中,这样在保持性能的同时简化了代码。但是,当我使用 Visual Studio 2015 时,这不起作用。对于相同的代码,我得到:
Valarr optimized case: 6652402
Optimal case: 1766699
差值几乎是四倍;没有优化!为什么std::valarray
在 Visual Studio 2015 上无法按需要工作?我做的一切都正确吗?如何在不放弃的情况下解决问题std::valarray
?