1

我需要获取一个页面的内容,该页面总是发送一个Content-Length: 0标题,但是页面永远不会为空。

只是返回一个空file_get_contents(url)字符串。

页面返回的整个标题是:

HTTP/1.1 200 OK
X-Powered-By: PHP/5.3.10
Expires: Mon, 26 Jul 1997 05:00:00 GMT
Last-Modified: Sat, 18 Feb 2012 18:14:59 GMT
Cache-Control: no-store, no-cache, must-revalidate
Cache-Control: post-check=0, pre-check=0
Pragma: no-cache
Content-Type: text/html; charset=UTF-8
Content-Length: 0
Date: Sat, 18 Feb 2012 18:14:59 GMT
Server: lighttpd

是否可以使用 file_get_contents 并忽略标题,还是我需要使用 curl?

编辑

get_headers(url)输出(使用print_r):

Array
(
    [0] => HTTP/1.0 200 OK
    [1] => X-Powered-By: PHP/5.3.10
    [2] => Content-type: text/html
    [3] => Content-Length: 0
    [4] => Connection: close
    [5] => Date: Sat, 18 Feb 2012 22:39:52 GMT
    [6] => Server: lighttpd
)
4

2 回答 2

0

我相信,没有一个 HTTP 级别的函数无法阅读这样的答案。因为它是不正确的 HTTP 答案,所以它说“我的身体是空的,不要阅读它”

你肯定需要你自己的基于 fread 的函数,它将物理读取套接字。像这样的东西:

$aURL    = parse_url($sURL);

if ($iHandle = fsockopen($aURL["host"], 80, $iError, $sError))
{
    $sQuery = substr($sURL, strpos($sURL, $aURL["host"]) + strlen($aURL["host"]));

    $sOut   = "GET " . (($sQuery != "") ? $sQuery : "/") . " HTTP/1.1\r\n";
    $sOut  .= "Host: " . $aURL["host"] . "\r\n";
    $sOut  .= "Connection: Close\r\n\r\n";

    fputs($iHandle, $sOut);

    while (!feof($iHandle))
    {
        $sResult .= fread($iHandle, 1024);
    }
}

然后只需剪掉标题。

于 2012-02-20T16:44:52.313 回答
0

正如 Optimist 所指出的,问题与标头无关,而是我没有向服务器发送任何 User-Agent 标头。

file_get_contents即使服务器总是返回Content-Length: 0.

奇怪的。

于 2012-05-30T19:03:10.820 回答