3

我在 PHP 中使用 cURL 来获取网页内容,效果很好。但是我的程序现在要求我只从目标站点获取纯文本,而不是 HTML。我对此进行了广泛的研究,但似乎没有人知道答案。我也尝试CURLOPT_TRANSFERTEXT=1在我的 cURL 选项中进行设置,但这似乎对结果没有影响。

知道为什么会这样吗?

4

4 回答 4

3

确保您具备以下条件:

curl_setopt($curl, CURLOPT_RETURNTRANSFER, true);

的返回值curl_exec应该是数据。

于 2011-03-03T01:12:15.827 回答
1

我认为这是您正在寻找的:

<?
$address = file_get_contents('http://www.thesite.com/file.html');
echo $address;



$file = file_get_contents('./file.txt', true);

 or 

$file = file_get_contents('./file.txt', FILE_USE_INCLUDE_PATH);

?>
于 2011-03-03T01:21:07.770 回答
0

实际上我确实喜欢这样来获取另一个页面的内容。

<?php
function curl_get_file_contents($URL)
    {
        $c = curl_init();
        curl_setopt($c, CURLOPT_RETURNTRANSFER, 1);
        curl_setopt($c, CURLOPT_URL, $URL);
        $contents = curl_exec($c);
        curl_close($c);

        if ($contents) return $contents;
            else return FALSE;
    }


echo curl_get_file_contents("http://www.php.net");
?>

但它返回给我的全部内容。

于 2011-03-03T02:57:10.583 回答
0

您的意思是要去掉页面上的所有 HTML 标记吗?

只需使用该strip_tags()功能

于 2011-03-03T04:15:19.283 回答