3

我正在尝试使用 Python 在 HTTP 上实现类似“tail -f”的东西。目前,我正在尝试使用 Tornado,但它一次只处理一个连接,即使我执行异步请求也是如此。

import socket
import subprocess

import tornado.gen as gen
import tornado.httpserver
import tornado.ioloop
import tornado.iostream
import tornado.options
import tornado.web

from tornado.options import define, options

define("port", default=8888, help="run on the given port", type=int)
define(
    "inputfile",
    default="test.txt",
    help="the path to the file which we will 'tail'",
    type=str)


class MainHandler(tornado.web.RequestHandler):
    @tornado.web.asynchronous
    @gen.engine
    def get(self):
        print "GOT REQUEST"
        inputfile = open(options.inputfile)
        p = subprocess.Popen(
            "./nettail.py",
            stdin=inputfile,
            stdout=subprocess.PIPE)
        port_number = int(p.stdout.readline().strip())

        self.write("<pre>")
        self.write("Hello, world\n")
        self.flush()

        s = socket.socket(socket.AF_INET, socket.SOCK_STREAM, 0)
        stream = tornado.iostream.IOStream(s)
        yield gen.Task(stream.connect, ("127.0.0.1", port_number))
        while True:
            data = yield gen.Task(stream.read_until, "\n")
            self.write(data)
            self.flush()

def main():
    tornado.options.parse_command_line()
    application = tornado.web.Application([
        (r"/", MainHandler),
    ])
    http_server = tornado.httpserver.HTTPServer(application)
    http_server.listen(options.port)
    tornado.ioloop.IOLoop.instance().start()


if __name__ == "__main__":
    main()

我开始的过程是一个简单的“尾巴”,它输出到一个套接字。

import random
import socket
import sys
import time

#create an INET, STREAMing socket
s = socket.socket(
    socket.AF_INET, socket.SOCK_STREAM)

# Open the connection.
try:
    for attempt_number in xrange(5):
        port_number = random.randint(9000, 65000)
        try:
            s.bind(("localhost", port_number))
        except socket.error:
            continue
        # We successfully bound!
        sys.stdout.write("{0}".format(port_number))
        sys.stdout.write("\n")
        sys.stdout.flush()
        break

    #become a server socket
    s.listen(5)

    # Accept a connection.
    try:
        (clientsocket, address) = s.accept()

        while True:
            line = sys.stdin.readline()
            if not line:
                time.sleep(1)
                continue
            clientsocket.sendall(line)
    finally:
        clientsocket.close()

finally:
    s.close()

./nettail.py 按我的预期工作,但 Tornado HTTP 服务器一次只处理一个请求。

我想使用长时间运行的持久 HTTP 连接来执行此操作,因为它与旧版浏览器兼容。我知道 Web Sockets 是在现代浏览器中完成的。

编辑:我在 Linux 和 Solaris 上运行它,而不是 Windows。这意味着我可以在文件上使用 tornado.iostream,而不是通过套接字程序。尽管如此,这还没有记录在案,所以我为每个连接启动了一个套接字程序。

4

3 回答 3

4

在进行了一些调试之后,事实证明这个尾部服务器并没有阻塞,毕竟。

我试图在打开 Firefox 的两个窗口的情况下测试并发连接,但 Firefox 在手动停止第一个窗口之前不会开始获取第二个窗口。我猜 Firefox 不喜欢有两个并发的 HTTP 连接来获取相同的资源。

打开一个 Firefox 窗口和一个 Chromium 窗口,我可以看到推送到两个选项卡的“尾部”输出。

谢谢你的帮助。@abarnert 的评论特别有帮助。

编辑:

在即将发布的 Tornado 2.4.2 版本中,实现了“管道”IOStream。使用这个和常规的“tail”大大简化了代码。

import subprocess

import tornado.httpserver
import tornado.ioloop
import tornado.iostream
import tornado.options
import tornado.web

from tornado.options import define, options

define("port", default=8888, help="run on the given port", type=int)
define(
    "inputfile",
    default="test.txt",
    help="the path to the file which we will 'tail'",
    type=str)


class MainHandler(tornado.web.RequestHandler):
    @tornado.web.asynchronous
    def get(self):
        print "GOT REQUEST"
        self.p = subprocess.Popen(
            ["tail", "-f", options.inputfile, "-n+1"],
            stdout=subprocess.PIPE)

        self.write("<pre>")
        self.write("Hello, world\n")
        self.flush()

        self.stream = tornado.iostream.PipeIOStream(self.p.stdout.fileno())
        self.stream.read_until("\n", self.line_from_nettail)

    def on_connection_close(self, *args, **kwargs):
        """Clean up the nettail process when the connection is closed.
        """
        print "CONNECTION CLOSED!!!!"
        self.p.terminate()
        tornado.web.RequestHandler.on_connection_close(self, *args, **kwargs)

    def line_from_nettail(self, data):
        self.write(data)
        self.flush()
        self.stream.read_until("\n", self.line_from_nettail)

def main():
    tornado.options.parse_command_line()
    application = tornado.web.Application([
        (r"/", MainHandler),
    ])
    http_server = tornado.httpserver.HTTPServer(application)
    http_server.listen(options.port)
    tornado.ioloop.IOLoop.instance().start()


if __name__ == "__main__":
    main()
于 2013-01-11T16:00:48.863 回答
1

我最近创建了这个作为实验。对我有多个连接有用吗?

class TailHandler(BaseHandler):
    @asynchronous
    def get(self):
        self.file = open('data/to_read.txt', 'r')
        self.pos = self.file.tell()

        def _read_file():
            line = self.file.read()
            last_pos = self.file.tell()
            if not line:
                self.file.close()
                self.file = open('data/to_read.txt', 'r')
                self.file.seek(last_pos)
                pass
            else:
                self.write(line)
                self.flush()

            IOLoop.instance().add_timeout(time.time() + 1, _read_file)
        _read_file()
于 2013-01-10T15:16:32.960 回答
-1

你不应该在处理程序中有这样的阻塞调用。

    port_number = int(p.stdout.readline().strip())

您需要使用select或类似的机制来避免阻塞调用

编辑:好的,我去检查了文档。您应该使用他们的iostream来读取p

于 2013-01-09T23:02:38.900 回答