我已经编写了一个抓取器,它执行 html 抓取,然后使用 API 来获取一些数据,因为它的代码非常冗长,我没有把它放在这里。我已经实现了随机睡眠方法并在我的代码中使用它来监控油门。但我想确保我不会过度运行这段代码,所以我的想法是运行 3-4 小时,然后休息一下,然后再次运行。我没有在 python 中做过这样的事情,我试图搜索,但不确定从哪里开始,如果我能得到一些指导,那就太好了。如果 python 有一个特定的模块链接,那将是一个很大的帮助。
这也相关吗?我不需要这种复杂程度?
我有每个抓取任务的函数,并且我有调用所有这些函数的 main 方法。