5

我目前有一个 for 循环来比较 2 个数组并确定它们是否相等。

public override bool Equals(object obj)
{
    RushHourPathLengthNode otherNode = (RushHourPathLengthNode)obj;

    // Compare their carCoords and return false as soon as we find a difference
    for (int i = 0, l = carCoords.Length; i < l; ++i)
        if (carCoords[i].x != otherNode.carCoords[i].x || carCoords[i].y != otherNode.carCoords[i].y)
            return false;
    return true;
}

这很好用,但它是我的程序中最慢的部分之一。这样我的测试用例大约需要 7 秒来计算。

虽然我可能有 50K 任务正在运行,但我的 i7 860 CPU(4 核,8 线程)上的 CPU 使用率约为 50%。

我的想法是使用并行 for 循环来最大化 CPU 使用率并使其更快。这就是我想出的。

public override bool Equals(object obj)
    {
        RushHourPathLengthNode otherNode = (RushHourPathLengthNode)obj;
        bool result = true;

        Parallel.For(0, carCoords.Length, (i, loopState) =>{
            if (!result)
                loopState.Stop();

            if (carCoords[i].x != otherNode.carCoords[i].x || carCoords[i].y != otherNode.carCoords[i].y)
                result = false;
        });

        return result;
    }

对我来说,这看起来像它会尝试并行运行,并且一旦发现差异,它就会因为 loopState.Stop 而停止工作。这样 CPU 使用率是 90%+,但我的测试用例需要大约 35 秒来计算,我不明白为什么。

我的实现有问题还是我的整个方法有问题?

编辑: carCoords.Length 将是 2 到 +-100 之间的值。听起来该值太低,无法证明并行执行此操作是合理的。

4

2 回答 2

3

首先,如果您的 for 循环只进行了 100 次迭代,请不要费心将其并行化。对于您在每次迭代中所做的工作,您需要进行数千次迭代才能使其有价值。

假设你有很多次迭代,大幅减速的主要原因是你在每次迭代中只做了一点点工作。在调度任务、调用方法体等方面有很多开销,并且支配了整个执行时间。

Partinioner.Create您可以通过使用(来自System.Collections.Concurrent命名空间)将范围划分为段来解决此问题。这为您提供了一个包含每个范围的开始和结束索引的元组序列。然后,您可以让每个任务在一个范围内迭代,这样效率更高。

其次,由于局部变量是在闭包对象中捕获的,因此有时在方法体内使用变量的局部副本会更快。

所以这就是我们得到的:

    Parallel.ForEach(Partitioner.Create(0, carCoords.Length), (r, loopState) => {
        var c1 = carCoords;
        var c2 = otherNode.carCoords;
        int end = r.Item2;
        for (int i = r.Item1; i < end; ++i) {
            if (loopState.IsStopped)
                return;
            if (c1[i].x != c2[i].x || c1[i].y != c2[i].y) {
                loopState.Stop();
                return;
            }
        }
    });

IsStopped我不确定检查每次迭代是否值得。拥有更多分区(使用Partitioner.Create重载)并将检查放在 for 循环之前可能会更有效。

于 2013-11-09T18:38:11.043 回答
1

在您的类上实现IEqutable<RushHourPathLengthNode>接口以避免强制转换。它会赢得你的秒。

如果 carCoords.Length 很小,则并行循环将花费更多时间,因为管理线程和切换成本很高。

于 2013-11-09T18:05:31.307 回答