0

下面有一个示例工作代码(parallel_for 使用并行模式库( ppl ))。这里的主要问题是sqr < concurrent_vector > 存储的值在每次执行中都会发生变化,但它不应该如此!

我使用 < concurrent_vector > 进行随机访问,为什么它不起作用?

#include <iostream>
#include <ppl.h>
#include <concurrent_vector.h>

using namespace std;
using namespace concurrency;

const int a = 10, b = 30;

critical_section cs;

int main() {

    concurrent_vector< int > labels( a * b );

    concurrent_vector< int > sqr( 5 );

    // filling label vector
    for ( int y = 0; y < b; y++ ) {
        for ( int x = 0; x < a; x++ ) {

            if( x<2 && y>3 )
                labels[ a * y + x ] = 1;
            else if( x<30 && y<5 )
                labels[ a * y + x ] = 2;
            else if( x>5 && y>10 )
                labels[ a * y + x ] = 3;
            else if( x>2 && y>20 )
                labels[ a * y + x ] = 4;
        }
    }

    // printing
    for ( int y = 0; y < b; y++ ) {
        for ( int x = 0; x < a; x++ ) {

            cout << labels[ a * y + x ] << ", ";
        }
        cout << endl;
    }

    parallel_for ( 0, b, [ & ]( int y ) {
        for ( int x = 0; x < a; x++ ) {

            //cs.lock();  // when i used it's working but slow
            int i = labels[ a * y + x ];
            //cs.unlock();

            if ( i < 0 ) continue;

            sqr[ i ] ++;
        }
    } );

    for( int i=0; i<5; i++ )
        cout << sqr[i] << ", ";
    cout << "" << endl;

    system ("pause");

    return 0;
}
4

2 回答 2

2

您没有使用与并发相关的并发向量的任何功能。实际上,您可以将其替换为标准向量,没有区别...显然, i 的值在内核的每次执行中都会重叠。绝对不能保证对向量的同一元素的并发写入是同步的。因此,您会得到随机结果——这只是非原子写入数据竞争的结果。

于 2013-10-12T07:45:45.657 回答
-1

使用task_group::wait方法应该更快(因为您不必每次都锁定/解锁)并且它可能会按您的预期工作。

此方法会阻止当前任务,直到另一个任务组的任务完成它们的工作。

请参阅 MSDN:并行任务

更新:我已经运行了一些计时测试,似乎这不是一个解决方案(除了我的双核上的大数据输入都失败了)。这可能是 Intel 的 TBB 中“concurrent_vector 中的设计”的错误 - tbb::concurrent_vector 返回错误的大小

于 2013-02-23T15:11:43.340 回答