1

我有一个名为的函数spider,它seed作为参数。seed是我发送给蜘蛛函数的 URL 的名称。现在我的问题是如何在 Python 中使用 beanstalkc 对 URL 进行排队并执行作业。

4

1 回答 1

1

根据教程,您需要:

  1. beantalkd 服务器正在运行。
  2. 连接:

    import beanstalkc
    beanstalk = beanstalkc.Connection(host='localhost', port=14711)
    
  3. 使用以下方法添加作业:

    beanstalk.put('seed url')
    
  4. 通过以下方式获得工作:

    job = beanstalk.reserve()
    spider(job.body)
    
  5. 将作业标记为已完成:

    job.delete()
    
于 2011-06-27T08:45:45.357 回答