我知道有人问了一些类似的问题,但我有点卡在这里。我找不到任何好的教程来帮助我解决这个问题。但是我想做的应该是非常基础的。假设我想在 Stackoverflow.com 上获取 H1“热门问题”,使用 Chrome 获取 Xpath 我得到了这个:
//*[@id="h-top-questions"]
所以我的问题是;我现在如何回应这个?使用来自整个网络的代码片段,我得到了这个:
<?php
$curl = curl_init('http://stackoverflow.com/');
curl_setopt($curl, CURLOPT_RETURNTRANSFER, true);
curl_setopt($curl, CURLOPT_FOLLOWLOCATION, true);
curl_setopt($curl, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US) AppleWebKit/534.10 (KHTML, like Gecko) Chrome/8.0.552.224 Safari/534.10');
$html = curl_exec($curl);
curl_close($curl);
if (!$html) {
die("something's wrong!");
}
//var_dump(strlen($data));
$dom = new DOMDocument();
@$dom->loadHTML($html);
$xpath = new DOMXPath($dom);
$headerh1 = $xpath->query('//*[@id="h-top-questions"]');
foreach($headerh1 as $match) {
print_r($match);
}
?>
我以为这只会输出<h1 id="h-top-questions">Top Questions</h1>
。但相反,我得到了
DOMElement Object
(
)
.
谁能帮帮我?我正在努力学习这个。