1
#include<iostream>
#include<fstream>
#include<time.h>
#include<omp.h>

using namespace std;
static long num_steps = 100;
#define NUM 8
double step;

void main()
{
    clock_t time =clock();
    ofstream result;
    result.open ("Result.txt");
    int a[100];
    double pi, sum=0.0; 
    step = 1.0/(double) num_steps;

    #pragma omp parallel num_threads(NUM)
    {           
        int i, ID;    
        double x, psum= 0.0; 
        int nthreads = omp_get_num_threads();
        ID = omp_get_thread_num();   
        for (i=ID;i<= num_steps; i+=nthreads)
        {
            x = (i+0.5)*step;
            psum += 4.0/(1.0+x*x);
        }
        #pragma omp critical
        sum += psum;
    }

    pi = step * sum; 
    for (int j=0;j<100;j++)
    result<<a[j]<<endl;

    time = clock() - time;

    result << "Time Elapsed: " << (((double)time)/CLOCKS_PER_SEC) << endl;

    result <<"======================================================================================="<<endl;
    result.close();
}

问题是: for (i=ID;i<= num_steps; i+=nthreads) 以下 for 循环按以下顺序执行线程:01234567 01234567 01234567 等...任务是将 for 循环更改为,以便线程均匀分布,而不是以舍入的方式分布。首先是 0,然后是 1,然后是 2.... 然后是 sevens 我应该如何更改 forloop?

4

1 回答 1

0

你必须为此使用某种线程同步......
你标记Visual Studio,所以我假设Windows平台......

最近这成了我的最爱:

// init
CRITICAL_SECTION hnd;
InitializeCriticalSectionAndSpinCount(&hnd,0x00000400);

// start lock
EnterCriticalSection(&hnd);
// stop lock
LeaveCriticalSection(&hnd);

// exit
DeleteCriticalSection(&hnd);

但是还有很多其他的方法。

  • 您也可以尝试制作自己的锁或无锁线程
  • 但请注意,在 Windows 7 等较新的操作系统中,进程调度器是不同的
  • 并且有发疯的倾向
  • 我的意思是在以前的 OS-es 上 100% 工作的无锁代码现在不稳定或冻结
  • 所以我更喜欢使用操作系统锁。

如果您错误地使用锁,您可能会失去多线程加速的任何好处。

如果您只是担心您的解决方案
在您的情况下不会同时计算线程而不是并行计算线程,那么它可能是由以下原因引起的:

  1. 处理时间粒度。

    • 任何已调度的任务都被划分为多个时间块。
    • 如果您的任务太短,那么它会在其他任务甚至开始执行之前完成。
    • 测试尝试更大的有效载荷(计算时间>几秒)
    • 大大增加循环次数
    • 添加 Sleep(time ms) 以获得更长的计算时间
    • 如果输出是混合的,那就是它
    • 如果不是,那么您仍处于粒度边界之下
    • 或者你的多线程代码是错误的
  2. 错误的多线程代码

    • 你支持你的线程同时创建/运行吗?
    • 还是您同步到错误的地方?(直到上一个任务结束)
    • 还有一些编译器做了大量的易失性变量(添加锁有时会做一些非常奇怪的事情......我多次遇到它,但主要是在 MCU 平台和 Eclipse 上)
  3. 单核

    • 在某些情况下,如果您只有 1 个 CPU/核心/计算机用于处理
    • 或者只是将关联掩码设置为单个 CPU
    • 在某些算法上,windows 调度器不会均匀地调度 CPU 时间
    • 即使不管进程/线程优先级/类
    • 即使对于更多 CPU,有时也会在 Windows 7 上出现类似的情况......
    • 尤其是与内核模式代码混合的代码

要玩粒度,您可以使用他的:

// obtain OS time capabilities
TIMECAPS tim; 
timeGetDevCaps(&tim,sizeof(tim));

// set new granularity
if (timeBeginPeriod(time ms)!=TIMERR_NOERROR) log("time granularity out of range");

// return to previous hranularity
timeEndPeriod(time ms ... must be the same as beginperiod);out of range");

PS。关于这个的非常好的东西在这里:

http://bitflipgames.com/2011/05/09/multithreaded-programming-part-1-the-critical-section-lock/ http://bitflipgames.com/2011/05/17/multithreaded-programming-part- 2-multiple-readerssingle-writer-lock/ http://bitflipgames.com/2011/05/20/multithreaded-programming-part-2-5-mrsw-lock-code/ http://bitflipgames.com/2011/ 05/25/多线程编程第 3 部分去无锁/

于 2013-12-13T10:49:17.930 回答