7

我正在使用一个 Web 应用程序,它允许用户在日历上创建事件(一次性或重复),并且在事件开始前不久,系统将通知其参与者。我在设计此类通知的流程时遇到了麻烦,尤其是对于重复发生的事件。

需要考虑的事项:

  1. Web 应用程序的体系结构使得有许多相同结构的数据库,每个数据库都有自己的一组用户和事件。因此,针对一个数据库的任何查询都需要针对数千个其他数据库进行。
  2. 重复事件可能具有排除日期(类似于 RRULE 和 EXDATE 组合)。

  3. 用户可以更新事件的时间/重复规则。

  4. 该应用程序是用 Python 编写的,并且已经使用带有 Redis 代理的 Celery 3.1。使用此设置的解决方案会很好,尽管任何事情都可以。根据我的发现,目前很难用 Celery 动态添加周期性任务。

我正在尝试的解决方案:

  • 定期任务每天运行一次,扫描每个数据库并添加任务以在适当的时间对当天重复发生的每个事件进行通知。

  • 如上生成的每个任务都有其 id 临时保存在 Redis 中。如果用户在其通知任务安排后更改了当天的事件时间,该任务将被撤销并替换为新的。

上述解决方案的示例代码:

  • tasks.py中,要运行的所有任务:

    from celery.task import task as celery_task
    from celery.result import AsyncResult
    from datetime import datetime
    
    # ...
    
    @celery_task
    def create_notify_task():
        for account in system.query(Account):
            db_session = account.get_session()    # get sql alchemy session
            for event in db_session.query(Event):
                schedule_notify_event(account, partial_event)
    
    
    @celery_task(name='notify_event_users')
    def notify_event_users(account_id, event_id):
        # do notification for every event participant
        pass
    
    def schedule_notify_event(account, event):
        partial_event = event.get_partial_on(datetime.today())
        if partial_event:
            result = notify_event_users.apply_async(
                    args = (account.id, event.id),
                    eta = partial_event.start)
            replace_task_id(account.id, event.id, result.id)
        else:
            replace_task_id(account.id, event.id, None)
    
    def replace_task_id(account_id, event_id, result_id):
        key = '{}:event'.format(account_id)
        client = redis.get_client()
        old_result_id = client.hget(key, event_id)
        if old_result_id:
            AsyncResult(old_result_id).revoke()
        client.hset(key, event_id, result_id)
    
  • event.py

    # when a user change event's time
    def update_event(event, data):
        # ...
        # update event
        # ...
        schedule_notify_event(account, event)
    
  • 芹菜设置文件:

    from celery.schedules import crontab
    
    CELERYBEAT_SCHEDULE = {
        'create-notify-every-day': {
            'task': 'tasks.create_notify_task',
            'schedule': crontab(minute=0, hour=0),
            'args': (,)
        },
    }
    

上述的一些缺点是:

  • 日常任务可能需要很长时间才能运行。最后处理的数据库中的事件必须等待并且可能会丢失。提前安排该任务(例如,第二天前 2 小时)可能会缓解这种情况,但是第一次运行设置(或在服务器重新启动之后)有点尴尬。

  • 必须注意不要为同一事件安排两次通知任务(例如,因为 create_notify_task 每天运行一次以上......)。

有没有更明智的方法来解决这个问题?

相关问题:

4

1 回答 1

4

好久没有答案了,我忘记了这个问题。无论如何,当时我采用了以下解决方案。我在这里概述一下,以防有人感兴趣。

  • 当一个事件被创建时,一个任务被安排在它下一次发生(即下一个通知时间)之前不久运行。计划时间是在应用所有重复和例外规则的情况下计算的,因此它只是一个简单的 celery 计划一次性任务。
  • 当任务运行时,它会执行通知作业,并在下一个通知时间安排新任务(同样,考虑所有重复规则和异常规则)。如果没有下一个事件发生,则不会安排新任务。
  • 任务的 id 与事件一起保存在数据库中。如果更改事件的时间,则取消任务并在新的下一个通知时间安排新任务。当任务运行并安排新任务时,新任务的 id 会保存在数据库中。

我能想到的一些优点和缺点:

  • 优点:
    • celery 中不需要复杂的重复规则,因为任务只安排一次运行。
    • 每个任务都相当小而且很快,因为它只需要关心一个事件通知。
  • 缺点:
    • 任何时候,都有大量的 celery 定时任务等待执行,大概在几十万的数量级上。我不确定这如何影响芹菜的性能,所以它可能是也可能不是真正的骗局。到目前为止,该系统似乎运行良好。
于 2017-10-09T08:46:33.223 回答