让我们从 Wikipedia中选择 Big-O 表示法的定义:
大 O 表示法是一种数学表示法,用于描述当参数趋于特定值或无穷大时函数的限制行为。
...
在计算机科学中,大 O 表示法用于根据算法的运行时间或空间需求如何随着输入大小的增长而增长来对算法进行分类。
所以 Big-O 类似于:
因此,当您在小范围/数字上比较两种算法时,您不能强烈依赖 Big-O。让我们分析一下这个例子:
我们有两种算法:第一种是O(1)并且恰好适用于 10000 个滴答声,第二种是O(n^2)。所以在 1~100 范围内,第二个会比第一个快(100^2 == 10000
所以(x<100)^2 < 10000
)。但是从 100 开始,第二个算法将比第一个慢。
类似的行为在您的函数中。我用各种输入长度对它们进行计时并构建时序图。以下是大数函数的时间安排(黄色为sort
,蓝色为heap
):
可以看到sort
比 消耗的时间更多heap
,而且时间提高的比 快heap's
。但是,如果我们仔细观察较低的范围:
我们会看到在小范围内sort
比heap
! 看起来heap
有“默认”时间消耗。因此,具有较差 Big-O 的算法比具有更好 Big-O 的算法运行得更快并没有错。这只是意味着它们的范围使用太小,以至于更好的算法比更差的算法更快。
这是第一个图的时序代码:
import timeit
import matplotlib.pyplot as plt
s = """
import heapq
def k_heap(points, K):
return heapq.nsmallest(K, points, key = lambda P: P[0]**2 + P[1]**2)
def k_sort(points, K):
points.sort(key = lambda P: P[0]**2 + P[1]**2)
return points[:K]
"""
random.seed(1)
points = [(random.random(), random.random()) for _ in range(1000000)]
r = list(range(11, 500000, 50000))
heap_times = []
sort_times = []
for i in r:
heap_times.append(timeit.timeit('k_heap({}, 10)'.format(points[:i]), setup=s, number=1))
sort_times.append(timeit.timeit('k_sort({}, 10)'.format(points[:i]), setup=s, number=1))
fig = plt.figure()
ax = fig.add_subplot(1, 1, 1)
#plt.plot(left, 0, marker='.')
plt.plot(r, heap_times, marker='o')
plt.plot(r, sort_times, marker='D')
plt.show()
对于第二个情节,更换:
r = list(range(11, 500000, 50000)) -> r = list(range(11, 200))
plt.plot(r, heap_times, marker='o') -> plt.plot(r, heap_times)
plt.plot(r, sort_times, marker='D') -> plt.plot(r, sort_times)