6

一般来说,我是 C# Parallel.ForEach、. 和 .NET 的新手。我想并行化涉及数千个位置的搜索。对于每个位置,我计算大圆距离。这是我想推广到不同核心的计算。我的问题是,如果我只有一个线程局部变量,如在这个MSDN TPL 示例中,我该怎么做?对于结果,我查看了Interlocked,并看到了它的选项AddCompareExchangeDecrement、和Exchange,但我不只是添加、递增、递减或测试相等性。我想通过多个并行运行的线程返回总体最短的对象IncrementRead距离。我的直觉说这应该很容易,我应该能够创建一些包裹 aLocation和距离的小对象,但是我如何从每个线程中捕获最佳答案,然后选择其中最短的距离?这是非并行版本:

Location findClosestLocation(Location myLocation, List<Location> allLocations)
{
  double closest = double.MaxValue;
  Location closestLoc = null;
  foreach (Location aLoc in allLocations)
  {
    if (aLoc != myLocation)
    {
      double d = greatCircle(myLocation, aLoc);
      if (d < closest)
      {
        closest = d;
        closestLoc = aLoc;
      }
    }
  }
  return closestLoc;
}

我确实看到了似乎提供了很好建议的DDJ 博客文章,但我想知道这是否是最好的建议。我看到作者在数组上循环,想知道是否没有更实用的方法来做到这一点。在函数世界中,我会使用map,lambdamin.

4

1 回答 1

11

这里最简单的选择是切换到 PLINQ:

Location findClosestLocation(Location myLocation, List<Location> allLocations)
{
     return allLocations
               .AsParallel()
               .Min(location => greatCircle(myLocation, location));
}

话虽如此,这基本上只是具有并行构造的聚合。如果您想坚持使用 Parallel 课程,您有几个选择。一种选择是使用锁定在块内自行同步。我不建议这样做,因为它会损害您的整体表现。

更好的选择是使用提供本地状态的Parallel.ForEach方法。他们将允许您将其重写为:

Location findClosestLocation(Location myLocation, List<Location> allLocations)
{
  double closest = double.MaxValue;
  Location closestLoc = null;
  object sync = new object();

  Parallel.ForEach<Location, Tuple<double,Location>(
      allLocations,
      () => new Tuple(double.MaxValue, null),
      (location, loopState, localState) =>
      {
          double d = greatCircle(myLocation, aLoc);
          if (d < localState.Item1)
              return new Tuple(d, aLoc);
          else
              return localState;
      },
      localState =>
      {
          lock(sync)
          {
              if (localState.Item1 < closest)
              {
                  closest = localState.Item1;
                  closestLoc = localState.Item2;
              }
          }
      }
  );
  return closestLoc;
}

我在我的博客上详细介绍了使用本地状态进行聚合。这基本上将操作更改为每个线程一个锁操作,而不是每个处理元素一个锁,因此您可以获得比简单锁定解决方案高得多的吞吐量。

于 2010-07-23T22:19:54.943 回答