c++ - 如何在 Cilk Plus 中组织非线程安全资源池（每个工作人员一个资源）？

Question

我有一个串行代码，我想使用 Cilk Plus 并行化；主循环对不同的数据集重复调用一个处理函数，所以迭代是相互独立的，除了使用了非线程安全的资源，它被封装在nts一个外部库提供的类中（比如，）它接受一个文件名并对其进行 I/O。

如果我使用的是 OpenMP，我将创建一个资源池，其中包含与我拥有的线程一样多的资源，并根据线程 ID 访问这些资源：

std::vector<nts> nts_pool;
for (std::size_t i{0}; i < omp_get_num_threads(); ++i)
    nts_pool.push_back(nts{});

nts_pool[omp_get_thread_num()].do_stuff();  // from inside the task

__cilkrts_get_nworkers()使用 Cilk Plus，我可以使用和API做尽可能多的事情__cilkrts_get_worker_number()，但是从英特尔论坛上的多个帖子中，我了解到这被认为是解决问题的错误解决方案，而正确的解决方案是使用持有人超对象。

现在，持有者解决方案看起来确实不错，除了我真的希望创建与工作线程一样多的视图。也就是说，对于 3 个工作线程，我想要 3 个对象而不是更多。理由是，正如我所说，资源是由第三方库提供的，构建起来非常昂贵，而且我必须在之后处理生成的文件，所以越少越好。

不幸的是，我发现持有者不是为每个工作人员创建一个视图并保持它直到同步，而是根据我不理解的逻辑以某种方式创建和销毁视图，并且似乎没有办法影响这种行为。

是否有可能让持有人按照我想要的方式行事，如果没有，我的问题的惯用 Cilk Plus 解决方案是什么？

这是我用来调查持有者的程序，请注意，它在一次运行期间在我的测试机器上创建多达 50 个视图，这些视图似乎是随机分配和销毁的：

#include <iostream>
#include <atomic>

#include <cilk/cilk.h>
#include <cilk/holder.h>
#include <cilk/reducer_ostream.h>
#include <cilk/cilk_api.h>

cilk::reducer_ostream *hyper_cout;

class nts {
public:
    nts() : tag_{std::to_string(++id_)} {
        *hyper_cout << "NTS constructor: " << tag_ << std::endl;
    }
    ~nts() {
        *hyper_cout << "NTS destructor: " << tag_ << std::endl;
    }
    void print_tag() {
        *hyper_cout << "NTS tag: " << tag_ << std::endl;
    }
    static void is_lock_free() {
        *hyper_cout << "Atomic is lockfree: " << id_.is_lock_free() << std::endl;
    }
private:
    const std::string tag_;
    static std::atomic_size_t id_;
};

std::atomic_size_t nts::id_{0};

class nts_holder {
public:
    void print_tag() { nts_().print_tag(); }
private:
    cilk::holder<nts> nts_;
};

int main() {

    __cilkrts_set_param("nworkers", "4");

    cilk::reducer_ostream cout{std::cout};
    hyper_cout = &cout;

    *hyper_cout << "Workers: " <<  __cilkrts_get_nworkers() << std::endl;
    nts::is_lock_free();

    nts_holder ntsh;
    ntsh.print_tag();

    for (std::size_t i{0}; i < 1000; ++i) {
        cilk_spawn [&] () {
            ntsh.print_tag();
        } ();
    }

    cilk_sync;

    return 0;

}

score 1 · Accepted Answer

你是对的，持有人是解决这个特定问题的诱人但低效的解决方案。__cilkrts_get_nworkers()如果您的程序正确地使用了每个工作人员一个插槽的插槽数组，那么在这种情况下使用和__cilkrts_get_worker_number()API确实没有任何问题。我们确实不鼓励使用它们；更喜欢编写忽略数字工作者的 Cilk Plus 代码，因为这样通常可以更好地扩展。但是，在某些情况下，包括这种情况，为每个工作人员创建一个插槽是最好的策略。

c++ - 如何在 Cilk Plus 中组织非线程安全资源池（每个工作人员一个资源）？

1 回答 1

Related

Reference