我有这个问题好几天了...我必须从 php 加载页面的整个 html。在此页面上,有一个 jquery 函数,当所有页面加载完毕时会调用该函数。此函数将其他 html 加载到页面中,因此我必须加载所有 html(也加载了 jquery 的部分)。我可以知道我让所有页面都试图找到一些仅从 jquery 加载的标签。(例如:名称为XXX的标签输入、属性多的标签输入等)
所以我尝试:
$html = file_get_contents("http://wwww.siteToScrape.com");
if (strpos($html, 'multiple') !== false) {
echo 'found';
} else {
echo 'not found';
}
但结果是“未找到”。
然后我下载了简单的 html dom并尝试:
include 'simple_html_dom.php';
$html = file_get_html("http://wwww.siteToScrape.com");
if (strpos($html, 'multiple') !== false) {
echo 'found';
} else {
echo 'not found';
}
但结果仍然“未找到”。
所以我想得到一些 php 脚本来模拟浏览器(所以也可以加载 jquery),我下载了PHP Scriptable Web Browser并尝试:
require_once('browser.php');
$browser = new SimpleBrowser();
$p = $browser->get('http://wwww.siteToScrape.com');
if (strpos($p, 'multiple') !== false) {
echo 'found';
} else {
echo 'not found';
}
但结果仍然是“未找到”。我不知道该怎么做..有人可以帮助我吗?谢谢!!!!