python - 何时使用，何时不使用 Python 3.5 `await`？

Question

我正在了解asyncio在 Python 3.5 中使用的流程，但我还没有看到关于我应该做什么await和不应该做什么或者可以忽略不计的描述。我是否只需要根据“这是一个 IO 操作，因此应该await编辑”来使用我的最佳判断？

score 107 · Accepted Answer

默认情况下，您的所有代码都是同步的。您可以使用异步定义函数async def并使用await. 一个更正确的问题是“我什么时候应该编写异步代码而不是同步代码？”。答案是“什么时候可以从中受益”。在您使用 I/O 操作的情况下，您通常会受益：

# Synchronous way:
download(url1)  # takes 5 sec.
download(url2)  # takes 5 sec.
# Total time: 10 sec.

# Asynchronous way:
await asyncio.gather(
    async_download(url1),  # takes 5 sec. 
    async_download(url2)   # takes 5 sec.
)
# Total time: only 5 sec. (+ little overhead for using asyncio)

当然，如果你创建了一个使用异步代码的函数，这个函数也应该是异步的（应该定义为async def）。但是任何异步函数都可以自由使用同步代码。无缘无故将同步代码转换为异步代码是没有意义的：

# extract_links(url) should be async because it uses async func async_download() inside
async def extract_links(url):  

    # async_download() was created async to get benefit of I/O
    html = await async_download(url)  

    # parse() doesn't work with I/O, there's no sense to make it async
    links = parse(html)  

    return links

一件非常重要的事情是，任何长时间的同步操作（例如，> 50 ms，很难准确地说出来）将冻结您在这段时间内的所有异步操作：

async def extract_links(url):
    data = await download(url)
    links = parse(data)
    # if search_in_very_big_file() takes much time to process,
    # all your running async funcs (somewhere else in code) will be frozen
    # you need to avoid this situation
    links_found = search_in_very_big_file(links)

您可以避免它在单独的进程中调用长时间运行的同步函数（并等待结果）：

executor = ProcessPoolExecutor(2)

async def extract_links(url):
    data = await download(url)
    links = parse(data)
    # Now your main process can handle another async functions while separate process running    
    links_found = await loop.run_in_executor(executor, search_in_very_big_file, links)

再举一个例子：当你需要requests在 asyncio 中使用时。requests.get只是同步长时间运行的函数，你不应该在异步代码中调用它（再次，以避免冻结）。但它运行时间长是因为 I/O，而不是因为计算时间长。在这种情况下，您可以使用ThreadPoolExecutor而不是ProcessPoolExecutor避免一些多处理开销：

executor = ThreadPoolExecutor(2)

async def download(url):
    response = await loop.run_in_executor(executor, requests.get, url)
    return response.text

score 2 · Accepted Answer

你没有太多的自由。如果你需要调用一个函数，你需要确定这是一个普通函数还是协程。await当且仅当您调用的函数是协程时，您必须使用关键字。

如果async涉及功能，则应该有一个“事件循环”来协调这些async功能。严格来说没有必要，您可以“手动”运行async向其发送值的方法，但可能您不想这样做。事件循环跟踪尚未完成的协程并选择下一个继续运行。asyncio模块提供了事件循环的实现，但这不是唯一可能的实现。

考虑这两行代码：

x = get_x()
do_something_else()

和

x = await aget_x()
do_something_else()

语义是完全一样的：调用一个产生一些值的方法，当值准备好时将它分配给变量x并做其他事情。在这两种情况下，do_something_else只有在上一行代码完成后才会调用该函数。这甚至不意味着在异步aget_x方法执行之前或之后或期间，控制权将让给事件循环。

还是有一些区别：

第二个片段只能出现在另一个async函数中
aget_x函数不是通常的，而是协程（即用async关键字声明或装饰为协程）
aget_x能够与事件循环“通信”：即为它产生一些对象。事件循环应该能够将这些对象解释为执行某些操作的请求（fe 发送网络请求并等待响应，或者只是暂停这个协程n几秒钟）。通常get_x的函数无法与事件循环通信。

python - 何时使用，何时不使用 Python 3.5 `await`？

2 回答 2

Related

Reference