这是我对点积的天真实现:
float simple_dot(int N, float *A, float *B) {
float dot = 0;
for(int i = 0; i < N; ++i) {
dot += A[i] * B[i];
}
return dot;
}
这是使用 C++ 库:
float library_dot(int N, float *A, float *B) {
return std::inner_product(A, A+N, B, 0);
}
我跑了一些基准(代码在这里https://github.com/ijklr/sse),库版本要慢很多。我的编译器标志是-Ofast -march=native