我正在编写一个简单的站点爬虫,我决定借此机会学习 Python 并发编程方面的新知识。我决定尝试其他方法,而不是使用线程和队列,但我不知道什么适合我。
我听说过 Stackless、Celery、Twisted、Tornado 和其他东西。我不想设置数据库和 Celery 的所有其他依赖项,但如果它适合我的目的,我会这样做。
我的问题是:我的应用程序的适用性和总体实用性之间的良好平衡是什么?我已经查看了 Stackless 中的 tasklet,但我不确定 urlopen() 调用是否会阻塞或者它们是否会并行执行,我在任何地方都没有看到过。
有人可以给我一些关于我的选择的详细信息以及最好使用什么吗?
谢谢。