我使用 celery 来更新我的新闻聚合站点中的 RSS 提要。我为每个提要使用一个@task,而且一切似乎都很好。
有一个细节我不确定如何处理好:所有提要每分钟使用@periodic_task 更新一次,但是如果启动新任务时提要仍在从上一个定期任务更新怎么办?(例如,如果提要真的很慢,或者离线并且任务处于重试循环中)
目前我存储任务结果并检查它们的状态,如下所示:
import socket
from datetime import timedelta
from celery.decorators import task, periodic_task
from aggregator.models import Feed
_results = {}
@periodic_task(run_every=timedelta(minutes=1))
def fetch_articles():
for feed in Feed.objects.all():
if feed.pk in _results:
if not _results[feed.pk].ready():
# The task is not finished yet
continue
_results[feed.pk] = update_feed.delay(feed)
@task()
def update_feed(feed):
try:
feed.fetch_articles()
except socket.error, exc:
update_feed.retry(args=[feed], exc=exc)
也许有一种更复杂/更强大的方法可以使用我错过的一些芹菜机制来实现相同的结果?