4

我将 Django 与 MongoEngine、django-celery 和 MongoDB 后端一起用于 celery。我正在排队一项任务。该任务涉及从 GridFS 获取文件(通过 MongoEngine FileField),对其进行操作并将其放回数据库中。

该任务按我预期的方式运行,无需排队。当我排队时,它会转换文件,但不会写入数据库。

这是我的 settings.py 的相关部分。

#These are apparently defaults that I shouldn't need
BROKER_BACKEND = 'mongodb'
BROKER_HOST = "localhost"
BROKER_PORT = 27017
BROKER_USER = ""
BROKER_PASSWORD = ""
BROKER_VHOST = ""

CELERY_RESULT_BACKEND = "mongodb" CELERY_MONGODB_BACKEND_SETTINGS = {
    "host": "localhost",
    "port": 27017,
    "database": "svg",
    "taskmeta_collection": "taskmeta", }

import djcelery djcelery.setup_loader()

我正在像这样运行芹菜

 $ ./manage.py celeryd -l info

当它运行任务时,芹菜说这个

[2011-07-23 16:07:11,858: INFO/MainProcess] Got task from broker: graphics.tasks.queue_convert[dfdf98ad-0669-4027-866d-c64971bb6480]
[2011-07-23 16:07:15,196: INFO/MainProcess] Task graphics.tasks.queue_convert[dfdf98ad-0669-4027-866d-c64971bb6480] succeeded in 3.33006596565s

(没有错误)

这是任务。

@task()
def queue_convert(imageId):
    image=Image.objects.get(id=imageId)
    convert(image)

convert 调用了一堆其他函数。基本上,它首先从 FileField 读取,操作该字符串,将该字符串写入文件,操作该文件,将生成的字符串和文件写入其他 FileField,然后运行 ​​image.save()。

根据我是否将任务排队,mongo 日志看起来会有所不同。这就是我使用任务队列时 mongo 日志中发生的情况。

Sat Jul 23 16:03:26 [initandlisten] connection accepted from 127.0.0.1:39065 #801
Sat Jul 23 16:03:26 [initandlisten] connection accepted from 127.0.0.1:39066 #802
Sat Jul 23 16:03:29 [initandlisten] connection accepted from 127.0.0.1:39068 #803

这就是当我直接调用 convert(image) 而不是调用 queue_convert(image.id) 时发生的情况

Sat Jul 23 16:07:13 [conn807] end connection 127.0.0.1:43630
Sat Jul 23 16:07:13 [initandlisten] connection accepted from 127.0.0.1:43633 #808
Sat Jul 23 16:07:13 [initandlisten] connection accepted from 127.0.0.1:43634 #809
Sat Jul 23 16:07:13 [conn808] end connection 127.0.0.1:43633

关于可能出现什么问题的任何想法?

4

1 回答 1

2

更新:我已经考虑过您遇到的更多问题,虽然听起来您已经为您解决了,但我会添加一些注释以防有人遇到类似问题。

Mongodb 使用“BSON”显式扩展 JSON,它将二进制和文件类型添加到支持的类型列表中。我只在 celery 文档中看到过“JSON”,所以我猜想将 mongodb 与 celery 一起使用并处理扩展集需要小心,因为听起来你在处理图像。

在 IPYTHON (11.0rc4) 的最新开发版本的文档中,他们讨论了他们的分布式工作系统。尽管术语听起来与 celery 相似,但后端可能完全不同。我认为 celery 在后端方面相对灵活,并且可能允许更高的安全性,这听起来像是 ipython 需要的 zeromq 的问题。但在数据库方面,根据文档,ipython 系统是“围绕 mongodb 从头开始​​设计的”,并且完全支持 bson。因此,如果您不太关心其他 celery 功能(当然,安全性、与 django 相关的开发基础等等),您可以研究一下。同样,这绝不是 celery 和 ipython 都应得的严格评估,只是可能的领先;ipython 还与其他科学计算库很好地集成,

祝你好运

原始答案:我同意 lazerscience - 这将有助于在这里有更多的背景。由于这些库的复杂性,有很多未知数。可能无法以本网站预期的严谨性来回答。

也就是说,我认为您可能遇到了序列化问题。Celery 要求您的对象是可腌制的,或者至少可以根据您选择的任何实现进行序列化(我知道它们也支持 JSON,尽管我已经够新手不确定 Pickle 和 JSON 是否完全重叠)。我看到你的函数只需要一个整数参数,这很好。但是转向 gridfs 是否意味着您正在尝试腌制图像?你当然可以用 celery 操作图像,但我不确定,尤其是在神秘的“转换”函数背后发生的一切,你是否可能不小心尝试序列化除 unicode、字典、整数、浮点数等以外的东西您的格式将支持的其他一些杂项对象。可能是你'

如果我离基地很远,请让我放松一点。我之所以做出回应,是因为我在这里和 mongoengine 用户组上都看到了您的消息,并认为您被卡住了,没有找到更专业的意见。您还可以仔细检查以确保您拥有相当最新的后端软件版本。我在某个时候遇到了一堆奇怪的 celery 问题,发现它们主要在我更新 rabbitmq 时得到了解决。祝你好运!

于 2011-07-28T15:19:59.297 回答