8

如果它的基础知识很抱歉,但我在互联网上没有找到任何比较这两种技术的答案。我应该如何决定何时使用哪个,因为两者都可以用来安排和处理定期任务。

这是一篇文章所说的:

Django 芹菜:

作业是在后台为您进行某些处理的任何应用程序的重要组成部分。如果你的工作是实时的,可以使用 Django 应用程序 celery。

Django-cronjobs:

django-cronjobs 可用于安排周期任务,这是一个有效的工作。django-cronjobs 是一个简单的 Django 应用程序,它通过管理命令运行已注册的 cron 作业。

谁能解释一下我什么时候应该选择哪个和为什么?我还需要知道为什么在分布式计算时使用 celery 以及为什么不使用 cron 作业

4

2 回答 2

16

这两件事可以用于同一个目标(后台执行)。但是,如果您要明智地选择,您应该真正了解它们实际上是完全不同的东西

这就是我希望当我还是个菜鸟时有人告诉我的(而不是我今天达到的新手级别:))。

cron

cron 作业的概念是我们希望命令/进程按某个时间表执行。此外,我们希望该进程接收 x,y,z 参数,使用 a,b,c 环境变量和用户 id 123 运行。

一些 cron 系统可能会促进一些额外的功能,例如:

  • 赶上错过的任务(例如,服务器因断电整夜关闭,一旦我们打开它,它就会运行我们通常每小时运行的命令的 8 个实例)。
  • 可能会帮助您处理通常使用 pid 文件执行的锁定类型,以避免并行运行同一命令。

在大多数情况下,cron 系统注定是愚蠢的:“此时只需运行此命令,谢谢!”。

芹菜

芹菜的概念要复杂得多。它适用于任务、任务链和和弦、错误处理以及(在大多数情况下)工作结果的收集。它有一个工作队列(或许多队列)和一个工作人员(或许多)。当一个任务(实际上只是描述请求工作的消息)进入队列时,它会在那里等待,直到有工作人员可以处理它。就像 DMV 的一名或多名员工为满屋等候的顾客提供服务一样。

此外,Celery 可以促进分布式工作。这有点像(如果我可以稍微折磨一下这个类比)——DMV 办公室之间的区别,每个员工共享相同的电话、计算机、复印机等,而 DMV 的员工拥有专用资源并且永远不会被其他员工阻止。

用于网络应用的 Celery

在 Web 应用程序中,当一些 Web 访问导致要做的事情应该在与 Web 浏览器的对话之外处理时,通常使用 Celery。例如:

  • 网络用户只是做了一些应该导致发送电子邮件的事情。为了发送电子邮件,您的网络服务器需要联系邮件服务器。这可能需要一些时间,服务器可能很忙,等等——我们不能让网络用户只是等待,在我们这样做的时候在他们的浏览器上什么也看不到。嗯,你可以,但它不会可靠地工作。因此,我们将电子邮件发送作为队列中的一项工作。这样,它可以“随时”发生,并且 Web 服务器可以恢复与浏览器的通信。

  • 用户刚刚提交了一张信用卡作为付款。您将需要联系卡处理器,但这可能需要几秒钟。您甚至可能需要多次联系他们(例如,他们现在真的很忙)。同样,您不希望用户的 Web 浏览器只是呆在原地不动,也不希望 Web 服务器进程或执行线程被捆绑。相反,您使用 Celery 创建作业,告诉浏览器在几秒钟后检查(或使用“网络套接字”),然后您的网络服务器继续运行并与其他网络用户对话。当浏览器稍后检查时,您查找任务 id 并从 celery 中了解它是否已完成以及结果是什么(卡被拒绝等)。

使用 Celery 作为 cron

当您将 Celery 用作“cron 系统”时,您真正要做的就是说:“嘿,有人可以按照 Y 计划生成 X 类型的工作吗”。创建了一个持续运行的进程,该进程大部分时间处于休眠状态,偶尔醒来,以按照您请求的时间表将一些工作注入队列。

通常,您要求为您执行此操作的“嘿某人”是:celery beat and beat从数据库中的某个位置或您的设置文件中获取您想要的时间表。

于 2019-11-26T16:25:38.713 回答