0

我有一个相当大的 HTML 文档,我试图从中提取信息。我已经弄清楚我可能需要使用 DOMDocument 对象和 xPath。我需要返回特定 DIV 的内容。好消息是它有一个与之关联的类标签。坏消息是它隐藏在 HTML 文档中的某个非特定位置,在其他 DIV 的几层内,并且该位置可能会改变。所以,我希望返回 div 的内容。

<div class='target'>Return all of this stuff</div>

诀窍似乎在于我不知道这个特定 div 将位于的特定位置。我需要一种方法来说“在整个 DOM 中搜索具有目标类名的 div”。可能有多个共同保险,但可能没有。但是,一旦我获得了可能是元素内容的数组,我就可以从那里获取它。再次,使用 PHP 5.4。

4

2 回答 2

2

您需要的 xpath 查询是:

$query = "//div[@class='target']";

您可以DOMXPath通过调用query方法将其与对象一起使用。

于 2013-02-15T03:42:30.000 回答
0

如果我理解正确,这可以单独使用原生 php 字符串处理来完成。

你有没有尝试过类似的东西。

$start = stripos($STRINGYOUARESEARCHING, "<div class='target'>")
$end= stripos($STRINGYOUARESEARCHING, "</div>",start);
$contents= substr($STRINGYOUARESEARCHING, $start, $end-$start)

如果这不是您要寻找答案,请告诉我...在这里,我假设您有一大块 HTML,其中包含您的目标?

(注意:您可能需要将 $end 或 $start 偏移strlen(<div class='target'>)

于 2013-02-15T03:43:56.300 回答