python - 尝试使用 timeit.timeit

Question

我想测量两个代码的运行时间，我尝试在python文档中查找timeit，但我并不太明白。有人可以用更初级的词汇来解释吗？

score 3 · Accepted Answer

我要告诉你一个秘密：最好的使用方式timeit是在命令行上。

在命令行上，timeit进行适当的统计分析：它告诉你最短的运行用了多长时间。这很好，因为时间上的所有错误都是积极的。所以最短的时间误差最小。没有办法得到负错误，因为计算机的计算速度永远不会超过它的计算速度！

所以，命令行界面：

%~> python -m timeit "1 + 2"
10000000 loops, best of 3: 0.0468 usec per loop

这很简单，嗯？

你可以设置东西：

%~> python -m timeit -s "x = range(10000)" "sum(x)"
1000 loops, best of 3: 543 usec per loop

这也很有用！

如果你想要多行，你可以使用 shell 的自动延续或使用单独的参数：

%~> python -m timeit -s "x = range(10000)" -s "y = range(100)" "sum(x)" "min(y)"
1000 loops, best of 3: 554 usec per loop

这给出了一个设置

x = range(1000)
y = range(100)

和时代

sum(x)
min(y)

如果您想拥有更长的脚本，您可能会倾向于移至timeitPython 脚本内部。我建议避免这种情况，因为在命令行上的分析和时间安排更好。相反，我倾向于制作 shell 脚本：

 SETUP="

 ... # lots of stuff

 "

 echo Minmod arr1
 python -m timeit -s "$SETUP" "Minmod(arr1)"

 echo pure_minmod arr1
 python -m timeit -s "$SETUP" "pure_minmod(arr1)"

 echo better_minmod arr1
 python -m timeit -s "$SETUP" "better_minmod(arr1)"

 ... etc

由于多次初始化，这可能需要更长的时间，但通常这没什么大不了的。

但是如果你想timeit在你的模块中使用呢？

好吧，简单的方法是：

def function(...):
    ...

timeit.Timer(function).timeit(number=NUMBER)

这给了你累积的（不是最少的！）时间来运行那个次数。

要获得良好的分析，请使用.repeat并采取此分钟：

min(timeit.Timer(function).repeat(repeat=REPEATS, number=NUMBER))

您通常应该将其与functools.partial而不是结合使用lambda: ...以降低开销。因此你可以有类似的东西：

from functools import partial

def to_time(items):
    ...

test_items = [1, 2, 3] * 100
times = timeit.Timer(partial(to_time, test_items)).repeat(3, 1000)

# Divide by the number of repeats
time_taken = min(times) / 1000

你也可以这样做：

timeit.timeit("...", setup="from __main__ import ...", number=NUMBER)

这将使您从命令行更接近界面，但以一种不那么酷的方式。允许您在"from __main__ import ..."由timeit.

值得注意的是，这是一个方便的包装器Timer(...).timeit(...)，因此并不是特别擅长计时。我个人更喜欢使用Timer如上所示。

警告

timeit到处都有一些警告。

间接费用不计入。假设你想 time x += 1，找出加法需要多长时间：
```
>>> python -m timeit -s "x = 0" "x += 1"
10000000 loops, best of 3: 0.0476 usec per loop
```
嗯，它不是0.0476 µs。你只知道它比这少。所有错误都是正面的。

所以试着找到纯粹的开销：
```
>>> python -m timeit -s "x = 0" ""      
100000000 loops, best of 3: 0.014 usec per loop
```
仅从时间来看，这是一个很好的30%开销！这会极大地扭曲相对时间。但是您只真正关心添加时间；的查找时间x也需要包含在开销中：
```
>>> python -m timeit -s "x = 0" "x"
100000000 loops, best of 3: 0.0166 usec per loop
```
差异不是很大，但它就在那里。

变异方法是危险的。

python -m timeit -s "x = [0]*100000" "while x: x.pop()"
10000000 loops, best of 3: 0.0436 usec per loop

但这是完全错误的！ x是第一次迭代后的空列表。您需要重新初始化：

>>> python -m timeit "x = [0]*100000" "while x: x.pop()"
100 loops, best of 3: 9.79 msec per loop

但是你有很多开销。单独考虑。

>>> python -m timeit "x = [0]*100000"                   
1000 loops, best of 3: 261 usec per loop

请注意，这里减去开销是合理的，因为开销只是时间的一小部分。

score 1 · Accepted Answer

我发现 IPython 的 %timeit 和 %%timeit 魔术函数比 timeit.timeit 更容易使用（尤其是在使用 ipython notebook 时）。这里有几个例子。

score 0 · Accepted Answer

>>> "-".join(str(n) for n in range(100))
'0-1-2-3-4-5-6-7-8-9-10-11-12-13-14-15-16-17-18-19-20-21-22-23-24-25-26-27-28-29-30-31-32-33-34-35-36-37-38-39-40-41-42-43-44-45-46-47-48-49-50-51-52-53-54-55-56-57-58-59-60-61-62-63-64-65-66-67-68-69-70-71-72-73-74-75-76-77-78-79-80-81-82-83-84-85-86-87-88-89-90-91-92-93-94-95-96-97-98-99'
>>>

假设这是您要运行的命令。
导入timeit. 将命令设为字符串，添加您想要运行它的次数。

>>> timeit.timeit('"-".join(str(n) for n in range(100))', number=100)
0.011214537887298093

文档
这个文档真的难以理解吗？我觉得很清楚。

python - 尝试使用 timeit.timeit

3 回答 3

警告

Related

Reference