11

几周前有人在这里发布了这个问题,但它看起来非常像没有事先研究的家庭作业,并且 OP 在得到一些反对意见后立即将其删除。

不过,这个问题本身相当有趣,我已经考虑了一周,但没有找到令人满意的解决方案。希望有人可以提供帮助?

问题如下:给定一个包含 N 个整数区间的列表,其边界可以从0到取任意值,找到不属于任何输入区间的最小整数。ii

例如,如果给定列表[3,5] [2,8] [0,3] [10,13](N = 4) ,算法应该返回9

我能想到的最简单的解决方案运行在 中O(n log(n)),包括三个步骤:

  1. 通过增加下限对区间进行排序
    • 如果最小下界>0,则返回0;
    • 否则重复将第一个区间与第二个区间合并,直到第一个区间(比如[a, b])不接触第二个区间(比如[c, d])——也就是说,直到 b + 1 < c,或者直到只有一个区间。
  2. 返回b + 1

这个简单的解决方案可以运行O(n log(n)),但原始发帖人写道,算法应该运行O(n)如果间隔已经排序,那是微不足道的,但是 OP 给出的示例包括未排序的间隔。我想它一定与bound有关,但我不确定是什么......散列?线性时间排序?欢迎提出想法。


这是上述算法的粗略python实现:

def merge(first, second):
    (a, b), (c, d) = first, second
    if c <= b + 1:
        return (a, max(b, d))
    else:
        return False

def smallest_available_integer(intervals):
    # Sort in reverse order so that push/pop operations are fast
    intervals.sort(reverse = True)

    if (intervals == [] or intervals[-1][0] > 0):
        return 0

    while len(intervals) > 1:
        first = intervals.pop()
        second = intervals.pop()

        merged = merge(first, second)
        if merged:
            print("Merged", first, "with", second, " -> ", merged)
            intervals.append(merged)
        else:
            print(first, "cannot be merged with", second)
            return first[1] + 1

print(smallest_available_integer([(3,5), (2,8), (0,3), (10,13)]))

输出:

Merged (0, 3) with (2, 8)  ->  (0, 8)
Merged (0, 8) with (3, 5)  ->  (0, 8)
(0, 8) cannot be merged with (10, 13)
9
4

2 回答 2

8

详细说明@mrip 的评论:您可以通过使用您描述的确切算法但更改排序算法的工作方式在 O(n) 时间内完成此操作。

通常,基数排序使用基数 2:根据元素的位是 0 还是 1,将元素分成两个不同的桶。基数排序的每一轮需要时间 O(n),并且每个最大数的位有一轮。调用最大的数字 U,这意味着时间复杂度为 O(n log U)。

但是,您可以将基数排序的基数更改为其他基数。使用基数 b,每一轮都需要时间 O(n + b),因为初始化和迭代桶需要时间 O(b),而将元素分配到桶中需要 O(n) 时间。然后有 log b U 轮。这给出了 O((n + b)log b U) 的运行时间。

这里的诀窍是,由于最大数 U = n 3,您可以设置 b = n 并使用 base-n 基数排序。轮数现在是 log n U = log n n 3 = 3,每轮需要 O(n) 时间,因此对数字进行排序的总工作量是 O(n)。更一般地,对于任何 k,您可以在 O(kn) 时间内对 [0, n k ) 范围内的数字进行排序。如果 k 是一个固定常数,这是 O(n) 时间。

结合您的原始算法,这可以在 O(n) 时间内解决问题。

希望这可以帮助!

于 2013-10-10T17:25:27.300 回答
0

另一个想法是以某种方式使用这些间隔的补码。假设 C() 为您提供区间的补码,例如 C([3,5]) 将是小于 3 和大于 5 的整数。如果最大数为 N^3,则使用模 N^ 3+1 你甚至可以将其表示为另一个区间 [6,(N^3+1)+2]。

如果你想要一个不属于任何原始区间的数字,那么这个相同的数字应该出现在这些区间的所有补集中。然后归结为编写一个函数,该函数可以计算任何两个这样的“补区间”的交集。

我还没有实现这个想法,因为我的纸笔画表明在计算这样的交点时需要考虑的情况比我最初想象的要多。但我认为这背后的想法是有效的,它会产生一个 O(n) 算法。

编辑

进一步思考,有一个最坏的情况使事情比我最初想象的更复杂。

于 2013-10-10T18:43:09.423 回答