2

我有一个名为mainsite.

该站点以相当异步的方式工作,主要是通过从视图启动的线程来执行后端操作。

它使用 sqlalchemy 连接到 mysql,并使用 ZopeTransactionExtension 进行会话管理。

到目前为止,该应用程序运行良好。

我需要在它上面运行定期作业,它需要使用一些从视图中启动的相同异步函数。

我使用了 apscheduler,但遇到了问题。所以我想到了使用 celery beat 作为一个单独的进程,将 mainapp 视为一个库并导入要使用的函数。

我的 celery 配置如下所示:

from datetime import timedelta
from api.apiconst import RERUN_CHECK_INTERVAL, AUTOMATION_CHECK_INTERVAL, \
    AUTH_DELETE_TIME

BROKER_URL = 'sqla+mysql://em:em@localhost/edgem'
CELERY_RESULT_BACKEND = "database"
CELERY_RESULT_DBURI = 'mysql://em:em@localhost/edgem'

CELERYBEAT_SCHEDULE = {
    'rerun': {
        'task': 'tasks.rerun_scheduler',
        'schedule': timedelta(seconds=RERUN_CHECK_INTERVAL)
    },
    'automate': {
        'task': 'tasks.automation_scheduler',
        'schedule': timedelta(seconds=20)
    },
    'remove-tokens': {
        'task': 'tasks.token_remover_scheduler',
        'schedule': timedelta(seconds=2 * 24 * 3600 )
    },
}

CELERY_TIMEZONE = 'UTC'

tasks.py 是

from celery import Celery
celery = Celery('tasks')
celery.config_from_object('celeryconfig')


@celery.task
def rerun_scheduler():
    from mainsite.task import check_update_rerun_tasks
    check_update_rerun_tasks()


@celery.task
def automation_scheduler():
    from mainsite.task import automate
    automate()


@celery.task
def token_remover_scheduler():
    from mainsite.auth_service import delete_old_tokens
    delete_old_tokens()

请记住,上述所有函数都会立即返回,但如果需要则启动线程

线程通过执行将对象保存到 db 中transaction.commit() after session.add(object)

问题是整个事情像宝石一样只能工作大约 30 分钟。之后,ResourceClosedError: The transaction is closed只要有transaction.commit(). 我不确定是什么问题,我需要帮助进行故障排除。

我在任务中导入的原因是为了摆脱这个错误。认为每次需要运行任务时都导入是一个好主意,我可能每次都会得到一个新事务,但看起来情况并非如此。

4

1 回答 1

9

根据我的经验,尝试将配置为与 Pyramid (与 ZopeTransactionExtension 等)一起使用的会话与 Celery 工作人员一起使用会导致可怕的难以调试的混乱。

ZopeTransactionExtension 将 SQLAlchemy 会话绑定到 Pyramid 的请求 - 响应周期 - 事务启动并自动提交或回滚,您通常不应该在代码中使用 transaction.commit() - 如果一切正常,中兴通讯将提交所有内容,如果你代码引发和异常您的事务将被回滚。

使用 Celery,您需要手动管理 SQLAlchemy 会话,中兴通讯阻止您这样做,因此您需要进行DBSession不同的配置。

像这样简单的东西会起作用:

DBSession = None

def set_dbsession(session):
    global DBSession
    if DBSession is not None:
        raise AttributeError("DBSession has been already set to %s!" % DBSession)

    DBSession = session

然后从 Pyramid 启动代码中执行

def main(global_config, **settings):
    ...
    set_dbsession(scoped_session(sessionmaker(extension=ZopeTransactionExtension())))

使用 Celery 有点棘手 - 我最终为 Celery 创建了一个自定义启动脚本,我在其中配置了会话。

在鸡蛋setup.py里:worker

  entry_points="""
  # -*- Entry points: -*-
  [console_scripts]
  custom_celery = worker.celeryd:start_celery
  custom_celerybeat = worker.celeryd:start_celerybeat
  """,
  )

worker/celeryd.py

def initialize_async_session(db_string, db_echo):

    import sqlalchemy as sa
    from db import Base, set_dbsession

    session = sa.orm.scoped_session(sa.orm.sessionmaker(autoflush=True, autocommit=True))
    engine = sa.create_engine(db_string, echo=db_echo)
    session.configure(bind=engine)

    set_dbsession(session)
    Base.metadata.bind = engine


def start_celery():
    initialize_async_session(DB_STRING, DB_ECHO)
    import celery.bin.celeryd
    celery.bin.celeryd.main()

如果您打算将应用程序部署到生产服务器上,那么您使用“从视图启动线程以执行后端操作”的一般方法对我来说有点危险——Web 服务器经常回收、杀死或创建新的“工人”,因此通常不能保证每个特定进程都能在当前的请求-响应周期之后继续存在。不过我从来没有尝试过这样做,所以也许你会没事的:)

于 2013-05-02T19:53:11.083 回答