14

使用 Tornado,我有一个 Get 请求需要很长时间,因为它向另一个 Web 服务发出许多请求并处理数据,可能需要几分钟才能完全完成。我不希望这会阻止整个 Web 服务器响应它当前所做的其他请求。

据我了解,Tornado 是单线程的,并且同步执行每个请求,即使它异步处理它们(仍然对此感到困惑)。漫长过程的某些部分可能是暂停点,以允许服务器处理其他请求(可能的解决方案?)。我用一个工人在 Heroku 上运行它,所以不确定这如何转化为产生一个新线程或多处理,我没有使用 python 的经验。

这是我正在尝试做的事情:客户端发出 get 调用以启动进程,然后我每 5 秒循环一次 get 调用以检查状态并使用新信息更新页面(长轮询也可以工作,但正在运行进入同一个问题)。问题是启动长进程会阻塞所有新的获取请求(或新的长轮询会话),直到它完成。

有没有一种简单的方法来启动这个漫长的 get 调用,而不是让它在这个过程中阻塞整个 Web 服务器?有什么我可以在代码中说的......“暂停,处理待处理的请求然后继续”?

我需要在 ProcessHandler 上发起一个获取请求。然后我需要在 ProcessHandler 运行时继续能够查询 StatusHandler。

例子:

class StatusHandler(tornado.web.RequestHandler):
    @tornado.web.asynchronous
    def get(self):
       self.render("status.html")

class ProcessHandler(tornado.web.RequestHandler):
    @tornado.web.asynchronous
    def get(self):
       self.updateStatus("0")
       result1 = self.function1()
       self.updateStatus("1")
       result2 = self.function2(result1)
       self.updateStatus("2")
       result3 = self.function3(result2)
       self.updateStatus("3")
       self.finish()
4

2 回答 2

18

这是一个完整的示例 Tornado 应用程序,它使用 Async HTTP 客户端和gen.Task模块使事情变得简单。

如果您gen.Task在文档中了解更多信息,您会发现实际上您可以同时发送多个请求。这是使用 Tornado 的核心思想,即一切都没有阻塞并且仍然保持单个进程。

更新:我添加了一个线程处理程序来演示如何将工作分派到第二个线程并在callback()完成时接收。

import os
import threading
import tornado.options
import tornado.ioloop
import tornado.httpserver
import tornado.httpclient
import tornado.web
from tornado import gen
from tornado.web import asynchronous

tornado.options.define('port', type=int, default=9000, help='server port number (default: 9000)')
tornado.options.define('debug', type=bool, default=False, help='run in debug mode with autoreload (default: False)')

class Worker(threading.Thread):
   def __init__(self, callback=None, *args, **kwargs):
        super(Worker, self).__init__(*args, **kwargs)
        self.callback = callback

   def run(self):
        import time
        time.sleep(10)
        self.callback('DONE')

class Application(tornado.web.Application):
    def __init__(self):
        handlers = [
            (r"/", IndexHandler),
            (r"/thread", ThreadHandler),
        ]
        settings = dict(
            static_path = os.path.join(os.path.dirname(__file__), "static"),
            template_path = os.path.join(os.path.dirname(__file__), "templates"),
            debug = tornado.options.options.debug,
        )
        tornado.web.Application.__init__(self, handlers, **settings)

class IndexHandler(tornado.web.RequestHandler):
    client = tornado.httpclient.AsyncHTTPClient()

    @asynchronous
    @gen.engine
    def get(self):
        response = yield gen.Task(self.client.fetch, "http://google.com")

        self.finish("Google's homepage is %d bytes long" % len(response.body))

class ThreadHandler(tornado.web.RequestHandler):
    @asynchronous
    def get(self):
        Worker(self.worker_done).start()

    def worker_done(self, value):
        self.finish(value)

def main():
    tornado.options.parse_command_line()
    http_server = tornado.httpserver.HTTPServer(Application())
    http_server.listen(tornado.options.options.port)
    tornado.ioloop.IOLoop.instance().start()

if __name__ == "__main__":
    main()
于 2012-10-24T15:04:19.790 回答
6

koblas 的解决方案很棒。这是使用tornado.gen的替代方法

import tornado.ioloop
import tornado.web
import tornado.gen
import tornado.concurrent
import time
from threading import Thread
from functools import wraps

def run_async(func):
  @wraps(func)
  def async_func(*args, **kwargs):
    func_hl = Thread(target = func, args = args, kwargs = kwargs)
    func_hl.start()
    return func_hl

  return async_func

@run_async
def sleeper(callback):
  i = 0
  while i <= 10:
    print i
    time.sleep(1)
    i += 1
  callback('DONE')


class MainHandler(tornado.web.RequestHandler):
    @tornado.web.asynchronous
    @tornado.gen.coroutine
    def get(self):
        response = yield tornado.gen.Task(sleeper)
        self.write(response)
        self.finish()

class OtherHandler(tornado.web.RequestHandler):
    def get(self):
        self.write('hello world')
        print 'in other'
        self.finish()
于 2013-04-11T15:15:14.370 回答