python - 使用 Big Θ 表示法的运行时间

Question

def filter(f, lst):     
    if lst == []: return []
    if f(lst[0]): return [lst[0]] + filter(f, lst[1:])
    return filter(f, lst[1:]) 

def my_reverse(lst):        # Reverse the list
    def reverse_helper(x,y):
        if x == []: return y
        return reverse_helper(x[1:], [x[0]] + y)
    return reverse_helper(lst, []) 

def revfilter_alpha(f, lst):    # Reverse and filter ...
    return my_reverse(filter(f, lst))

def revfilter_beta(f, lst): # Reverse and filter ...
    if lst == []: return []
    return revfilter_beta(f, lst[1:]) + ([lst[0]]  if f(lst[0])  else [])

有人可以向我解释如何确定这些的 Big Θ 符号的运行时间吗？我已经阅读了很多东西，但仍然不知道从哪里开始。

在filter中，我认为它是 Θ(n^2)，因为它使用谓词函数 f 检查大小为 n 的列表中的每个元素，并进行 n 个递归调用，因此 n*n。

revfilter_beta看起来很相似，只是在过滤时反转，所以这不是 Θ(n^2) 吗？

revfilter_alpha过滤然后反向，所以这不是n ^ 2 * n ^ 2 = Θ（n ^ 4）吗？

有人有想法吗？

score 5 · Accepted Answer

filter有n递归调用，但你也对每次迭代进行复制操作n，所以你最终得到 Θ(n^2)。如果你“正确地”实现它，它应该是 Θ(n)。

对my_reverse.

对revfilter_beta.

revfilter_alpha只做 afilter然后 a reverse，所以 Θ(n^2 + n^2) = Θ(n^2)。

编辑：让我们filter再看看。

您要弄清楚的是相对于输入的大小执行了多少操作。O(n)意味着在最坏的情况下，您将按照操作顺序进行n操作。我说“按顺序”是因为您可以进行O(n/2)操作，或者O(4n)，但最重要的因素是n. 也就是说，随着n增长，常数因素变得越来越不重要，所以我们只看非常数因素（n在这种情况下）。

filter那么，对 size 的列表执行多少操作n？

让我们从下往上看。如果n是 0 - 一个空列表怎么办？然后它只会返回一个空列表。因此，假设这是 1 次操作。

如果n是 1 呢？它将检查是否lst[0]应该包括在内——不管调用需要多长时间f——然后它会复制列表的其余部分，并对该副本进行递归调用，在这种情况下是一个空列表。所以filter(1)需要f + copy(0) + filter(0)操作，其中copy(n)是复制列表需要f多长时间，以及检查是否应包含元素需要多长时间，假设每个元素花费相同的时间。

怎么样filter(2)？它将进行 1 次检查，然后复制列表的其余部分并调用filter其余部分：f + copy(1) + filter(1)。

你已经可以看到模式了。filter(n)需要1 + copy(n-1) + filter(n-1).

现在，copy(n)只是n- 它需要n操作以这种方式对列表进行切片。所以我们可以进一步简化：filter(n) = f + n-1 + filter(n-1).

现在您可以尝试扩展filter(n-1)几次，看看会发生什么：

filter(n) = f + n-1 + filter(n-1)
          = 1 + n-1 + (f + n-2 + filter(n-2))
          = f + n-1 + f + n-2 + filter(n-2)
          = 2f + 2n-3 + filter(n-2)
          = 2f + 2n-3 + (f + n-3 + filter(n-3))
          = 3f + 3n-6 + filter(n-3)
          = 3f + 3n-6 + (f + n-4 + filter(n-4))
          = 4f + 4n-10 + filter(n-4)
          = 5f + 5n-15 + filter(n-5)
          ...

我们可以概括x重复吗？那个1, 3, 6, 10, 15... 序列是三角形数字 - 即 , , 1,等。从到的所有数字的总和是。1+21+2+31+2+3+41xx*(x-1)/2

          = x*f + x*n - x*(x-1)/2 + filter(n-x)

现在，什么是x？我们会有多少次重复？好吧，您可以看到当x=时n，您不再有递归 - filter(n-n)= filter(0)= 1。所以我们的公式现在是：

filter(n) = n*f + n*n - n*(n-1)/2 + 1

我们可以进一步简化：

filter(n) = n*f + n^2 - (n^2 - n)/2 + 1
          = n*f + n^2 - n^2/2 + n/2 + 1
          = n^2 - n^2/2 + f*n + n/2 + 1
          = (1/2)n^2 + (f + 1/2)n + 1

所以你有它 - 一个相当详细的分析。那将是Θ((1/2)n^2 + (f + 1/2)n + 1)......假设f是微不足道的（比如f= 1）Θ((1/2)n^2 + (3/2)n + 1)。

现在您会注意到，如果copy(n)花费了恒定的时间而不是线性的时间（如果copy(n)是 1 而不是n），那么您将不会n^2在那里得到该术语。

我承认，当我Θ(n^2)最初说的时候，我并没有在脑海中做这一切。相反，我想：好的，你有n递归步骤，每个步骤都会花费n大量时间，因为copy. n*n = n^2，因此Θ(n^2)。为了更准确地做到这一点n，每一步都会缩小，所以你真的有n + (n-1) + (n-2) + (n-3) + ... + 1，最终与上面的数字相同：n*n - (1 + 2 + 3 + ... + n)= n*n - n*(n-1)/2= (1/2)n^2 + (1/2)n，如果我在上面使用0而不是 ,也是一样的f。同样，如果您有n步骤但每个步骤都采取了1而不是n（如果您不必复制列表），那么您将拥有1 + 1 + 1 + ... + 1、ntimes 或简单n的 .

但是，这需要更多的直觉，所以我想我也会向你展示你可以应用于任何事情的蛮力方法。

score 2 · Accepted Answer

您的所有功能都是O(N^2)因为它们每个递归步骤都需要时间，并且长度列表中O(N)会有步骤。NN

O(N)您在函数中执行了两个昂贵的（即）操作。第一个是切片（例如lst[1:]）。第二个是列表连接（使用+运算符）。

这两个可能都比您预期的要贵，主要是因为 Python 的列表不像其他语言中的列表数据类型。在引擎盖下它们是数组，而不是链表。可以在 O(1) 时间内对链表执行上述操作（尽管O(1)切片具有破坏性）。例如，在 Lisp 中，您使用的算法是O(N)，而不是O(N^2)。

递归在 Python 中也经常是次优的，因为没有尾调用消除。在最近的版本中，Python 的默认递归限制是 1000，所以长列表会破坏纯粹的递归解决方案，除非你在sys模块中乱来增加限制。

也可以O(N)在 Python 中执行这些算法的一个版本，但您需要尽可能避免上述昂贵的列表操作。我建议不要使用递归，而是使用生成器，这是一种更“pythonic”的编程风格。

使用生成器进行过滤非常容易。内置filter函数已经完成了，但您只需几行代码即可编写自己的函数：

def my_filter(f, iterable):
    for e in iterable:
        if f(e):
            yield e

颠倒事物的顺序有点复杂，因为您需要能够对源进行随机访问或使用O(N)额外的空间（您的算法使用该空间的堆栈，即使列表遵循序列协议并且可以是随机的访问）。内置reversed函数仅适用于序列，但这里有一个适用于任何可迭代对象（例如另一个生成器）的版本：

def my_reversed(iterable):
    storage = list(iterable)  # consumes all the input!
    for i in range(len(storage)-1, -1, -1):
        yield storage[i]

请注意，与许多生成器不同，this on 在开始产生输出之前会立即消耗其所有输入。不要在无限输入上运行它！

您可以按任意顺序组合它们，并且my_reversed(filter(f, lst))应该等效于filter(f, my_reversed(lst))（尽管对于后者，使用内置reversed函数可能更好）。

上述两个生成器的运行时间（以及它们的组成以任一顺序）将为O(N).

python - 使用 Big Θ 表示法的运行时间

2 回答 2

Related

Reference