如果我有以下 X(HTML) 结构,你如何在 div 树的深处捕获那个 imgur 链接?
我尝试了几种不同的方法。我真正想要的是为包含“siteTable”的 div 创建一个节点树,因为该 div 中有许多包含更多 imgur 链接的 div。如果你没有注意到,这是 reddit 的 html。
谢谢!
<html lang="en" xml:lang="en" xmlns="http://www.w3.org/1999/xhtml">
<head>
<body class="listing-page hot-page">
<div id="header" role="banner">
<div class="side">
<a name="content"></a>
<div class="content" role="main">
<div class="infobar welcome">
<div id="siteTable" class="sitetable linklisting">
<div class=" thing id-t3_1gh823 over18 odd link " data-downs="5" data-ups="90" data-fullname="t3_1gh823" onclick="click_thing(this)">
<p class="parent"></p>
<span class="rank" style="width:2.20ex;">1</span>
<div class="midcol unvoted" style="width:5ex;">
<a class="thumbnail " href="http://i.imgur.com/FZ1I9wi.jpg">
这是我知道需要做的事情:
$dom = new domDocument;
@$dom->loadHTML(file_get_contents($link));
$dom->preserveWhiteSpace = false;
$xpath = new DOMXPath($dom);
$href = $xpath->query('?????');
print_r($tags);