66

我有以下代码:

@asyncio.coroutine
def do_something_periodically():
    while True:
        asyncio.async(my_expensive_operation())
        yield from asyncio.sleep(my_interval)
        if shutdown_flag_is_set:
            print("Shutting down")
            break

我运行这个函数直到完成。设置关闭时会出现问题 - 功能完成并且任何挂起的任务都不会运行。

这是错误:

task: <Task pending coro=<report() running at script.py:33> wait_for=<Future pending cb=[Task._wakeup()]>>

如何正确安排关机?

为了给出一些上下文,我正在编写一个系统监视器,它每 5 秒从 /proc/stat 读取一次,计算该期间的 cpu 使用率,然后将结果发送到服务器。我想继续安排这些监控作业,直到我收到 sigterm,当我停止安排时,等待所有当前作业完成,然后优雅地退出。

4

7 回答 7

65

您可以检索未完成的任务并再次运行循环,直到它们完成,然后关闭循环或退出程序。

pending = asyncio.all_tasks()
loop.run_until_complete(asyncio.gather(*pending))
  • pending是待处理任务的列表。
  • asyncio.gather()允许一次等待多个任务。

如果你想确保所有任务都在一个协程中完成(也许你有一个“主”协程),你可以这样做,例如:

async def do_something_periodically():
    while True:
        asyncio.create_task(my_expensive_operation())
        await asyncio.sleep(my_interval)
        if shutdown_flag_is_set:
            print("Shutting down")
            break

    await asyncio.gather(*asyncio.all_tasks())

此外,在这种情况下,由于所有任务都是在同一个协程中创建的,因此您已经可以访问这些任务:

async def do_something_periodically():
    tasks = []
    while True:
        tasks.append(asyncio.create_task(my_expensive_operation()))
        await asyncio.sleep(my_interval)
        if shutdown_flag_is_set:
            print("Shutting down")
            break

    await asyncio.gather(*tasks)
于 2015-01-12T21:12:54.253 回答
16

从 Python 3.7 开始,上述答案使用多个已弃用的 API(asyncio.async 和 Task.all_tasks、@asyncio.coroutine、yield from 等),您应该使用以下方法:

import asyncio


async def my_expensive_operation(expense):
    print(await asyncio.sleep(expense, result="Expensive operation finished."))


async def do_something_periodically(expense, interval):
    while True:
        asyncio.create_task(my_expensive_operation(expense))
        await asyncio.sleep(interval)


loop = asyncio.get_event_loop()
coro = do_something_periodically(1, 1)

try:
    loop.run_until_complete(coro)
except KeyboardInterrupt:
    coro.close()
    tasks = asyncio.all_tasks(loop)
    expensive_tasks = {task for task in tasks if task._coro.__name__ != coro.__name__}
    loop.run_until_complete(asyncio.gather(*expensive_tasks))
于 2018-08-26T10:02:16.707 回答
13

我注意到一些建议使用的答案asyncio.gather(*asyncio.all_tasks()),但问题有时可能是一个无限循环,它等待asyncio.current_task()完成,这就是它本身。一些答案提出了一些涉及检查coro名称的复杂解决方法 or len(asyncio.all_tasks()),但事实证明,利用set操作很简单:

async def main():
    # Create some tasks.
    for _ in range(10):
        asyncio.create_task(asyncio.sleep(10))
    # Wait for all other tasks to finish other than the current task i.e. main().
    await asyncio.gather(*asyncio.all_tasks() - {asyncio.current_task()})
于 2021-08-03T03:01:21.867 回答
4

使用一个包装协程,该协程等到挂起的任务计数为 1 后再返回。

async def loop_job():
    asyncio.create_task(do_something_periodically())
    while len(asyncio.Task.all_tasks()) > 1:  # Any task besides loop_job() itself?
        await asyncio.sleep(0.2)

asyncio.run(loop_job())
于 2019-07-09T03:00:54.160 回答
3

我不确定这是否是您所要求的,但我遇到了类似的问题,这是我想出的最终解决方案。

该代码与 python 3 兼容,仅使用公共 asyncio API(意味着没有 hacky_coro和不推荐使用的 API)。

import asyncio

async def fn():
  await asyncio.sleep(1.5)
  print('fn')

async def main():
    print('main start')
    asyncio.create_task(fn()) # run in parallel
    await asyncio.sleep(0.2)
    print('main end')


def async_run_and_await_all_tasks(main):
  def get_pending_tasks():
      tasks = asyncio.Task.all_tasks()
      pending = [task for task in tasks if task != run_main_task and not task.done()]
      return pending

  async def run_main():
      await main()

      while True:
          pending_tasks = get_pending_tasks()
          if len(pending_tasks) == 0: return
          await asyncio.gather(*pending_tasks)

  loop = asyncio.new_event_loop()
  run_main_coro = run_main()
  run_main_task = loop.create_task(run_main_coro)
  loop.run_until_complete(run_main_task)

# asyncio.run(main()) # doesn't print from fn task, because main finishes earlier
async_run_and_await_all_tasks(main)

输出(如预期):

main start
main end
fn

该 async_run_and_await_all_tasks 函数将使 python 以 nodejs 方式运行:仅当没有未完成的任务时才退出。

于 2019-08-25T07:56:40.390 回答
2

您也可以考虑使用asyncio.shield,尽管这样做您不会完成所有正在运行的任务,而只会得到shielded。但它在某些情况下仍然有用。

除此之外,从 Python 3.7 开始,我们还可以在此处使用高级 API 方法asynio.run。作为 Python 核心开发人员,Yury Selivanov 建议: https ://youtu.be/ReXxO_azV-w?t=636
注意: asyncio.run 函数已在 Python 3.7 中临时添加到 asyncio 中。

希望有帮助!

import asyncio


async def my_expensive_operation(expense):
    print(await asyncio.sleep(expense, result="Expensive operation finished."))


async def do_something_periodically(expense, interval):
    while True:
        asyncio.create_task(my_expensive_operation(expense))
        # using asyncio.shield
        await asyncio.shield(asyncio.sleep(interval))


coro = do_something_periodically(1, 1)

if __name__ == "__main__":
    try:
        # using asyncio.run
        asyncio.run(coro)
    except KeyboardInterrupt:
        print('Cancelled!')
于 2019-02-02T20:57:40.683 回答
1

如果您想要一种干净的方式来等待在某个本地范围内创建的所有正在运行的任务而不会泄漏内存(并同时防止垃圾收集错误),您可以维护一组正在运行的任务并使用task.add_done_callback(...)它从集合中删除任务。这是一个为您处理此问题的类:

class TaskSet:
    def __init__(self):
        self.tasks = set()

    def add(self, coroutine: Coroutine) -> Task:
        task = asyncio.create_task(coroutine)
        self.tasks.add(task)
        task.add_done_callback(lambda _: self.tasks.remove(task))
        return task

    def __await__(self):
        return asyncio.gather(*self.tasks).__await__()

可以这样使用:

async def my_function():
    await asyncio.sleep(0.5)


async def go():
    tasks = TaskSet()
    for i in range(10):
        tasks.add(my_function())
    await tasks
于 2021-03-04T09:59:27.520 回答