1

我有一个可行的并行化解决方案。然而,并行化对执行时间的改善非常非常轻微。我认为这是因为我在循环中新建并删除了一些变量。我希望它是堆栈创建的,但是 Command 类是抽象的,并且必须保持抽象。我能做些什么来解决这个问题?如何改善花在这些非常长的循环上的时间???

#pragma omp parallel for  reduction(+:functionEvaluation)
for (int i=rowStart;i<rowEnd+1;i++)
{
    Model model_(varModel_);
    model_.addVariable("i", i);
    model_.addVariable("j", 1);
    Command* command_ = formulaCommand->duplicate(&model_);
    functionEvaluation += command_->execute().toDouble();
    delete command_;
}

问题也可能出在其他地方!欢迎咨询!!

谢谢并恭祝安康。

4

2 回答 2

1

您可能想要使用privateorfirstprivate子句

#pragma会包含...private(varModel, formulaCommand)...或类似的,然后每个线程都会有自己的这些变量的副本。使用firstprivate将确保线程特定变量具有复制的初始值,而不是未初始化。这将消除对newand的需要delete,假设您可以只修改每次循环迭代的实例。

这可能会也可能不会按预期工作,因为您没有提供很多细节。

于 2012-04-16T14:35:57.437 回答
1

我认为您应该尝试使用一种机制来重用分配的内存。您可能不知道Command对象的大小或对齐方式,因此“足够大”的缓冲区是不够的。我会让你的duplicate方法接受两个参数,第二个是对 a 的引用boost::pool。如果池对象足够大,只需在其中构造新Command对象,如果它没有扩展它,则构造到其中。boost::pool将为您处理对齐问题,因此您不必考虑它。这样,您只需为每个线程执行几次动态内存分配。

顺便说一句,在 C++ 中返回原始指针通常不是一个好习惯。改用智能指针,没有任何但更好的方式...好吧,在这种情况下有一个但是:),因为根据我的建议,您将在后台进行一些自定义内存管理。尽管如此,最好的做法是编写一个自定义智能指针,它可以优雅地处理您的特殊情况,而不会冒着用户搞砸的风险。你当然可以像其他人一样做,在这种情况下例外:)(我的建议在正常情况下仍然有效,在上面的问题中,你通常应该使用类似的东西boost::scoped_ptr

于 2012-04-16T16:24:18.577 回答