3

对于学校,我们有一项任务是创建一个多线程应用程序。我们选择进行归并排序的多线程实现。

然而,我们无法让它比串行实现更快地工作。

我已经尝试过以下方法:

  • 无限线程的实现(代码示例 1)(非常慢)
  • 线程有限的实现(代码示例 2)(最多 4 个线程 - 仍然很慢)
  • 使用 Parallel.Invoke 实现(代码示例 3)(仍然较慢)
  • 复杂的实现也具有并行合并功能(只是慢得可耻)

当我在 Visual Studio(仪器部分)中使用分析工具时,我发现调用函数的时间和线程解决方案总是比串行实现慢得多。

我看不出有任何可能的原因。

(例如:要排序 5000000 个数字;串行实现:16.717,17;并行:20.259,97;结果只需 1 个额外线程)

我在我拥有的两台机器上测试了它:

  • Intel Core 2 Quad Q9450 @ 2.66Ghz
  • 英特尔酷睿 i7 Q720 @1.60Ghz

我一生都无法弄清楚这是怎么可能的,这不应该只是加快进程吗?

如果有人能够帮助我,我会非常高兴。

代码示例1:

ParallelMerge pMerge = new ParallelMerge(T, p1, q1 -1, p2, q2-1, A, p3);
Thread thread = new Thread(new ThreadStart(pMerge.parallel_merge));
thread.Start();

ParallelMerge pMerge2 = new ParallelMerge(T, q1 + 1, r1, q2, r2, A, q3 + 1);
pMerge2.parallel_merge();
thread.Join();

代码示例 2:

if(depthRemaining > 0)
{
   ParallelMerge pMerge = new ParallelMerge(T, p1, q1 -1, p2, q2-1, A, p3);
   thread thread = new Thread(new ThreadStart(pMerge.parallel_merge));
   thread.Start();
   ParallelMerge pMerge2 = new ParallelMerge(T, q1 + 1, r1, q2, r2, A, q3 + 1);
   pMerge2.parallel_merge(); 
   thread.Join();
}
else
{
   ParallelMerge pMerge = new ParallelMerge(T, p1, q1 -1, p2, q2-1, A, p3);
   pMerge.parallel_merge(); 
   ParallelMerge pMerge2 = new ParallelMerge(T, q1 + 1, r1, q2, r2, A, q3 + 1);
   pMerge.parallel_merge(); 
}

代码示例 3:

if (depthRemaining > 0)
{
   Parallel.Invoke(
      () => threaded_merge_sort(getallen, p, q, depthRemaining-1));

   threaded_merge_sort(getallen, q + 1, r, 0);
}
else
{
   threaded_merge_sort(getallen, p, q, 0);
   threaded_merge_sort(getallen, q+1, r, 0);
}
4

2 回答 2

2

您报告的时间单位是什么?

启动一个新线程是一个“慢”操作。使用多线程对非常短的列表进行排序/合并可能会慢一些。

如果你只是将数字列表的长度分成两半,程序运行得更快吗?如果不是,您的代码根本无法扩展。

在没有实际代码实现的情况下回答这个问题有点困难。

于 2012-05-14T09:06:41.923 回答
0

似乎问题不在于代码,而在于 VS 的分析工具。

——阿恩·克莱尔布特

于 2012-10-23T19:03:45.200 回答