我想使用 PHP 获取网站的内部 HTML,可以吗?
我只知道file_get_contents($URL)
获取源的方法。
您可以curl
用于发送 HTTP 标头和另一个套接字参数。
您可以使用 Simple HTML Dom 来遍历和解析格式良好的 HTML:
http://sourceforge.net/projects/simplehtmldom/
例如:
<?php
include_once('simple_html_dom.php');
$html = file_get_html('http://target.page.com');
// Output the contents of <div id="target-id">
$content = $html->find('div#target-id');
echo $content[0]->plaintext;
// Output the entire page as plaintext
echo $html->plaintext;
?>
文档可以在这里找到: