我想与 openMP 并行化一个对盒子进行采样的函数(在盒子中随机选择点,并在这些点评估给定函数)。我写了以下代码。
//storing points
double** points_ = new double*[N-m];
for(int i=0;i<N-m;i++)
{
points_[i]=new double[ndim];
}
double* evals_ = new double[N-m];
#pragma omp parallel for
for(int i=0;i<N-m;i++)
{
double* pt_ = randomPoint(lower,upper);
for(int k=0;k<ndim;k++)
{
points_[i][k]=pt_[k];
}
evals_[i]=evalFunc(pt_);
delete pt_;
}
但是,我对这段代码没有信心: evals_ 和 points_ 在每个线程中更新。我想在那里添加一些原子语句:
#pragma omp parallel for
for(int i=0;i<N-m;i++)
{
double* pt_ = randomPoint(m_lower,m_upper);
for(int k=0;k<m_ndim;k++)
{
#pragma omp atomic update
points_[i][k]=pt_[k];
}
#pragma omp atomic update
evals_[i]=evalFunc(pt_);
delete pt_;
}
但我担心这会非常低效:您有什么建议可以更准确地编写它吗?而且...这不是编译...(错误:#pragma omp atomic 之后的表达式格式不正确)虽然我可以在 openMP 规范 A22 中找到该示例
void atomic_example(float *x, float *y, int *index, int n)
{
int i;
#pragma omp parallel for shared(x, y, index, n)
for (i=0; i<n; i++) {
#pragma omp atomic update
x[index[i]] += work1(i);
y[i] += work2(i);
}
}
并且原子更新之后也是对数组的影响。
谢谢并恭祝安康。
编辑 - - - -
我同意都铎的回答。但是,似乎这里的这个例子,在另一段并行化的代码中确实需要原子:在行 sum_+=... 时,发生错误(并发访问)
for(i=0;i<m_ndim;i++)
{
double sum_=0;
#pragma omp parallel reduction(+:sum_)
for(j=0;j<m_npts;j++)
{
sum_ += set_[j][i];
}
Sum_[i] = sum_;
}
为什么需要它?还是有其他错误?