有多个相关问题,但我正在寻找针对我的案例的解决方案。有一个(通常)14 个整数的数组。如何快速判断每个 int 是否恰好出现两次(即有 7 对)?取值范围从 1 到 35。这里的主要方面是性能。


var pairs = Array
    .GroupBy (x => x)
    .Where (x => x.Count () == 2)
    .Select (x => x.ToList ())
    .ToList ();
IsSevenPairs = pairs.Count == 7;

使用 Linq 是可选的。我不在乎如何,只要它快:)

编辑:在特殊情况下,int 出现 2n 次且 n > 1。在这种情况下,检查应该失败,即应该有 7 个不同的对。

编辑:结果 我用微小的修改测试了 Ani 和 Jon 的解决方案,并在目标应用程序的多个基准测试运行期间发现,Ani 在我的机器上的吞吐量大约是 Jon 的两倍(Win7-64 上的一些 Core 2 Duo)。生成整数数组所需的时间与相应检查的时间差不多,所以我对结果很满意。谢谢大家!


public bool CheckForPairs(int[] array)
    // Early out for odd arrays.
    // Using "& 1" is microscopically faster than "% 2" :)
    if ((array.Length & 1) == 1)
        return false;

    int[] counts = new int[32];
    int singleCounts = 0;
    foreach (int item in array)
        int incrementedCount = ++counts[item];
        // TODO: Benchmark to see if a switch is actually the best approach here
        switch (incrementedCount)
            case 1:
            case 2:
            case 3:
                return false;
                throw new InvalidOperationException("Shouldn't happen");
    return singleCounts == 0;


(我不知道这是否会比 Ani 的递增方法更快或更慢,然后再检查不匹配的对。)

于 2010-11-15T15:22:21.070 回答

显然,LINQ 不会在这里提供最佳解决方案,尽管我会将您当前的 LINQ 解决方案改进为:

// checks if sequence consists of items repeated exactly once
bool isSingleDupSeq = mySeq.GroupBy(num => num)
                           .All(group => group.Count() == 2);

// checks if every item comes with atleast 1 duplicate
bool isDupSeq = mySeq.GroupBy(num => num)
                     .All(group => group.Count() != 1);

对于您提到的特定情况(0 - 31),这是一个更快的基于数组的解决方案。当可能的数字范围很大时(在这种情况下使用散列解决方案),它不能很好地扩展。

// elements inited to zero because default(int) == 0
var timesSeenByNum = new int[32];

foreach (int num in myArray)
    if (++timesSeenByNum[num] == 3)
        //quick-reject: number is seen thrice
        return false;

foreach (int timesSeen in timesSeenByNum)
    if (timesSeen == 1)
        // only rejection case not caught so far is
        // if a number is seen exactly once
        return false;

// all good, a number is seen exactly twice or never
return true;   

编辑:修复了 Jon Skeet 指出的错误。我还应该指出,他的算法更聪明,可能更快。

于 2010-11-15T15:19:50.857 回答

如果项目的范围是 0-31,则可以在 uint32 中存储 32 个一位标志。我建议获取每个项目并计算掩码 =(1 SHL 项目),看看如果您尝试“或”、“异或”或添加掩码值会发生什么。查看有效和无效案例的结果。为避免溢出,您可能希望使用 uint64 进行加法(因为如果有两个 31、四个 30 或八个 29,uint32 可能会溢出)。

于 2010-11-15T16:02:55.347 回答

当你只有 14 对并且只有 32 对可能的值时,几乎可以肯定是矫枉过正,但在一般情况下,你可以这样做:

bool onlyPairs = yourArray.ContainsOnlyPairs();

// ...

public static class EnumerableExtensions
    public static bool ContainsOnlyPairs<T>(this IEnumerable<T> source)
        var dict = new Dictionary<T, int>();

        foreach (T item in source)
            int count;
            dict.TryGetValue(item, out count);

            if (count > 1)
                return false;

            dict[item] = count + 1;

        return dict.All(kvp => kvp.Value == 2);
于 2010-11-15T15:25:03.240 回答

我将创建一个由 32 个整数元素组成的数组,初始化为零。我们称它为“比利”。

对于输入数组的每个元素,我将 billy[element] 增加 1。

最后,检查 billy 是否只包含 0 或 2。

于 2010-11-15T15:23:12.880 回答


int[] array = { 0, 1, 2, 3, 1, 1, 3, 5, 1, 2, 7, 31 }; // this is your sample array

uint[] powOf2 = {
    1, 2, 4, 8,
    16, 32, 64, 128,
    256, 512, 1024, 2048,
    4096, 8192, 16384, 32768,
    65536, 131072, 262144, 524288,
    1048576, 2097152, 4194304, 8388608,
    16777216, 33554432, 67108864, 134217728,
    268435456, 536870912, 1073741824, 2147483648

uint now;
uint once = 0;
uint twice = 0;
uint more = 0;

for (int i = 0; i < array.Length; i++)
    now = powOf2[array[i]];

    more |= twice & now;
    twice ^= (once & now) & ~more;
    twice ^= more;
    once |= now;

您可以在变量“两次”中获得双倍的值;当然它只适用于小于 32 的值;

于 2010-11-15T16:23:32.943 回答