3

这件事已经困扰我一段时间了,到目前为止我在网上找不到原因/解决方案。这是设置:

我有一个在浏览器上运行的胖 JS 客户端,向内部系统发起搜索请求。这些请求只是 GET 的,没什么特别的。它们返回一个 URL,一旦搜索结果可用,就会将其放入其中。

然后我轮询给定的 URL 以获取结果(不时地,比如每 5 分钟一次)并处理要呈现给用户的数据。该 URL 指向一个压缩的结果文件,它只是一个纯文本 (ASCII)。

现在......搜索结果通常在几百行文本内,但偶尔会有数十万行文本,有时是 7-10MB 的文本(解压缩后)。这就是浏览器显示悲伤标签页的地方。

(无需指出这种方法的安全问题,它们数量众多且非常有效)。

没有什么特别的 - 只是打电话给

$.ajax({
    url: '/cgi-bin/ajax_gz.cgi',
    type: 'POST',
    data: 'curl -k "' + self.url_res + '"',
    dataType: 'html',
    success: function (_data, _status, _xhr) {
        self.update_result(_data, _status, _xhr);
    },
    error: function (_xhr, _status, _error) {
        self.set_status(Status.ACK);
    },
    timeout: 5 * ONE_MINUTE
});

ajax_gz.cgi只不过是一个简单的哑代理(允许我的 JS 通过中继curl请求从不同的域中提取数据)更复杂的地方:

#!/bin/bash
echo "Content-type: text/html"
echo "Content-encoding: gzip"
echo ""
/bin/bash

返回的确实是压缩后的 HTML,所以我为此设置了标题。我想我可以更新 ajax() 配置中的标题,但这似乎是一种更简单的方法。

successor函数永远不会被调用,error超时(5 分钟)也不是问题——它都在 LAN 上,整个传输不到半分钟。

我可以毫无问题地在选项卡中打开该 URL,它会显示解压缩的计划 ASCII 文本。但是当使用 jQuery 的 ajax() 检索数据时,我面临着一个悲伤的标签页(几乎每次,但仅适用于“部分内容”HTTP 206 响应)。

我错过了什么?尝试在 JS 调试器中“逐步执行”并没有多大帮助,因为我得到的只是一个突然的悲伤标签,然后调试会话被终止。

更新:单步执行 jQuery 代码并在readyState===4' 函数处停止,我能够捕捉到响应。它是HTTP 200全文(从开始<html>标签一直到结束标签,在单个<pre>标签之间有 108K 行)。一旦我得到那个回应并试图“扩大”this我得到一个悲伤标签页的价值

4

2 回答 2

0

由于您的 bash 代理(哎呀!)不执行任何 gzip 压缩,并且 curl 通常会解压缩它使用 Content-Encoding: gzip 接收的任何内容,我假设来自您的内部服务器的响应是 gzip 后返回的,但没有 Content-Encoding标题存在。

听起来您的 curl 脚本正在从您的内部服务器获取 206,对吗?这有点奇怪,因为服务器应该只返回 206 以响应 Range 标头。但是,假设这是给定的,您将获得 gzip 压缩内容的部分响应,并将其作为 200 传递给 Chrome。当然,这不会使 Chrome 崩溃,但其中可能存在错误。

也许尝试解压缩:

#!/bin/bash
echo "Content-type: text/html"
echo ""
curl -k "`cat`" | gunzip

您还想更改您的 Ajax 数据源:

data: self.url_res,

如果失败,请尝试使用 -i 从 curl 捕获完整标头以进行进一步调试。

于 2013-04-17T14:03:46.033 回答
0

我认为您遇到了 Chrome 内存限制。对此chrome 的编码可能对 AJAX 调用有 3000 个字符的限制。

正如您所注意到的,开发人员工具显示了这一切,但是当阅读它以返回给 jQuery 时,它遇到了某种形式的天花板。您可以尝试将您的响应限制在该限制以下,看看它是否有效?也许尝试使用其他浏览器?

如果这是问题所在,您可以尝试分部分返回结果。退回的一些零件可能会绕过限制。

于 2013-04-06T06:32:58.013 回答