几天来,我一直在用一个 python 应用程序苦苦挣扎,我希望在文件夹中查找一个或多个文件,并遍历每个文件和其中的每条记录,并创建要持久保存在 Janusgraph 数据库中的对象。我正在使用的特定 OGM 要求使用 asyncio 以异步方式完成与数据库的事务。我已经阅读了很多关于 asyncio 的博客和帖子,并且我想我理解 async、await、task 等的概念......在我的应用程序中,我定义了几个处理不同部分的函数:
- 检索所有可用文件的列表
- 选择一个文件进行处理
- 遍历选定的文件并读取一行/记录进行处理
- 接收记录,确定解析 from in 并调用其他几个函数,这些函数负责在将模型对象持久化到数据库之前创建模型对象。例如,我创建了不同的功能:用户、会话、浏览器、设备使用、服务器等......
我理解(我可能是错的)使用 asyncio 的最大优势在于对函数的调用通常会因 I/O、数据库事务、网络延迟等而阻塞的情况......
所以我的问题是我是否需要将我的所有函数转换为协程并安排运行事件循环,或者只是那些会阻塞的函数,比如将事务提交到数据库。我一开始就尝试了这种方法,但遇到了各种各样的问题。