16

我正在使用 django 和 celery(django-celery) 开发一个项目。我们的团队决定将所有数据访问代码包装在(app-name)/manager.py其中(而不是像django这样包装到管理器中),并让 (app-name)/task.py 中的代码只处理 celery 的组装和执行任务(所以我们没有 django此层中的 ORM 依赖项)。

在我的manager.py,我有这样的事情:

def get_tag(tag_name):
    ctype = ContentType.objects.get_for_model(Photo)
    try:
        tag = Tag.objects.get(name=tag_name)
    except ObjectDoesNotExist:
        return Tag.objects.none()
    return tag

def get_tagged_photos(tag):
    ctype = ContentType.objects.get_for_model(Photo)
    return TaggedItem.objects.filter(content_type__pk=ctype.pk, tag__pk=tag.pk)

def get_tagged_photos_count(tag):
    return get_tagged_photos(tag).count()

在我的 task.py 中,我喜欢将它们包装成任务(然后可能使用这些任务来完成更复杂的任务),所以我编写了这个装饰器:

import manager #the module within same app containing data access functions

class mfunc_to_task(object):
    def __init__(mfunc_type='get'):
        self.mfunc_type = mfunc_type

    def __call__(self, f):
        def wrapper_f(*args, **kwargs):
            callback = kwargs.pop('callback', None)

            mfunc = getattr(manager, f.__name__)

            result = mfunc(*args, **kwargs)
            if callback:
                if self.mfunc_type == 'get':
                    subtask(callback).delay(result)
                elif self.mfunc_type == 'get_or_create':
                    subtask(callback).delay(result[0])
                else:
                    subtask(callback).delay()
            return result            

        return wrapper_f

然后(仍在task.py):

#@task
@mfunc_to_task()
def get_tag():
    pass

#@task
@mfunc_to_task()
def get_tagged_photos():
    pass

#@task
@mfunc_to_task()
def get_tagged_photos_count():
    pass

没有@task. 但是,在应用了那个@task装饰器之后(按照 celery 文档的指示放在顶部),事情就开始分崩离析。显然,每次调用时,都会传递mfunc_to_task.__call__相同的函数作为. 所以我每次都得到相同的结果,现在我唯一要做的就是得到一个标签。task.get_tagfwrapper_f

我是装饰师的新手。任何人都可以帮助我理解这里出了什么问题,或者指出其他方法来完成任务?我真的很讨厌为我的每个数据访问函数编写相同的任务包装代码。

4

2 回答 2

20

不太清楚为什么传递参数不起作用?

如果您使用此示例:

@task()
def add(x, y):
    return x + y

让我们向 MyCoolTask​​ 添加一些日志记录:

from celery import task
from celery.registry import tasks

import logging
import celery

logger = logging.getLogger(__name__)

class MyCoolTask(celery.Task):

    def __call__(self, *args, **kwargs):
        """In celery task this function call the run method, here you can
        set some environment variable before the run of the task"""
        logger.info("Starting to run")
        return self.run(*args, **kwargs)

    def after_return(self, status, retval, task_id, args, kwargs, einfo):
        #exit point of the task whatever is the state
        logger.info("Ending run")
        pass

并创建一个扩展类(扩展 MyCoolTask​​,但现在带有参数):

class AddTask(MyCoolTask):

    def run(self,x,y):
        if x and y:
            result=add(x,y)
            logger.info('result = %d' % result)
            return result
        else:
            logger.error('No x or y in arguments')

tasks.register(AddTask)

并确保将 kwargs 作为 json 数据传递:

{"x":8,"y":9}

我得到结果:

[2013-03-05 17:30:25,853: INFO/MainProcess] Starting to run
[2013-03-05 17:30:25,855: INFO/MainProcess] result = 17
[2013-03-05 17:30:26,739: INFO/MainProcess] Ending run
[2013-03-05 17:30:26,741: INFO/MainProcess] Task iamscheduler.tasks.AddTask[6a62641d-16a6-44b6-a1cf-7d4bdc8ea9e0] succeeded in 0.888684988022s: 17
于 2013-03-05T16:36:12.943 回答
9

为什么不创建扩展的基类而不是使用装饰器celery.Task

这样,您的所有任务都可以扩展您自定义的任务类,您可以在其中使用方法__call__after_return . 您还可以为所有任务定义通用方法和对象。

class MyCoolTask(celery.Task):

    def __call__(self, *args, **kwargs):
        """In celery task this function call the run method, here you can
        set some environment variable before the run of the task"""
        return self.run(*args, **kwargs)

    def after_return(self, status, retval, task_id, args, kwargs, einfo):
        #exit point of the task whatever is the state
        pass
于 2011-06-18T07:29:39.333 回答