2

我对 Python 比较陌生,来自 .Net 背景。

简短版本:如何创建应用程序范围的单例或其他机制以允许多个线程/进程相互通信?

也许我被宠坏了,但在.Net 中,我只是App_Start在“应用程序级别”中创建一些东西或其他东西。我怎样才能在 python/uwsgi 中做同样的事情?

长版:

我们有一个使用 Django 编写的 restful API。

一些调用需要一些预处理,然后传递到执行长时间运行操作的后端系统。

目前的流程看起来像......

  • 接收处理所有符合给定条件的文件的请求
  • Api 确定哪些文档符合这些标准(大约 100,000 - 需要 15-20 秒)
  • Api 为这个批处理请求生成一个 uuid
  • Api 将消息发布到每个文档的后端队列,引用批处理 id。
  • Api 在不同的队列上侦听“已完成”消息并计算每个批次 ID 的成功/失败(约 1-15 分钟)
  • 在处理过程中,UI 可以请求更新特定批次 ID

我们需要使用与用于服务页面的线程不同的线程来监听响应队列,因为它处于等待自旋循环中......

while True:
    self.channel.wait()

我通过引用QueueManager一个单例来处理这个问题。管理器触发初始请求,记录批处理 ID,然后在第二个线程中监视队列并更新本地状态。

我们实际上并不关心长期保留状态 - 如果消息在队列中,则处理将由后端完成,状态监控只是向用户提示事情正在进行中。如果他们浏览离开,他们也会失去对状态的访问权限(批次 ID 存储在 JS 的内存中)

这有几个好处——我们避免使用数据库来同步信息(以及相关的清理)。我们能够使用单个线程作为消息使用者,并且不必担心并发问题,因为只有一个线程会收集消息/更新本地状态。

所以......现在是时候使用 uwsgi 运行它了,我发现了一个主要问题。如果我将进程数设置为 1,则单例会按预期工作,但在 api 处理数据的 15-20 秒期间,所有请求都会被阻止。显然这是不可接受的。相反,如果我启动多个工作人员,每个工作人员都有自己的单例和自己的消息侦听器 - 所以如果发布者和消费者是同一个进程,这几乎是随机的。即使是这样,状态更新请求也可能不会在同一过程中结束。

如何在多个工作人员之间交换状态信息?有没有办法使用多个线程而不是多个工人?

看来我真的需要:

  • n个线程,每个服务请求
  • 1个线程监听队列
  • 它们之间的一些内存中通信方式

注意我已经有了--enable-threads,但这似乎只适用于我产生的新线程(不知道为什么默认情况下不会启用)

4

1 回答 1

0

要生成多个线程,只需添加 --threads N 其中 N 是要生成的线程数。

请注意,它仅在您有一个工作人员/进程时才有效。另一种常见的方法是使用 uWSGI 缓存框架(名称具有误导性,实际上是共享字典)。它将允许您在工作人员和线程之间共享数据。

于 2013-04-30T16:36:21.857 回答