我有一个名为的函数spider
,它seed
作为参数。seed
是我发送给蜘蛛函数的 URL 的名称。现在我的问题是如何在 Python 中使用 beanstalkc 对 URL 进行排队并执行作业。
问问题
2037 次
1 回答
1
根据教程,您需要:
- beantalkd 服务器正在运行。
连接:
import beanstalkc beanstalk = beanstalkc.Connection(host='localhost', port=14711)
使用以下方法添加作业:
beanstalk.put('seed url')
通过以下方式获得工作:
job = beanstalk.reserve() spider(job.body)
将作业标记为已完成:
job.delete()
于 2011-06-27T08:45:45.357 回答