0

我想要的是检索<a>特定标签之间的 HTML 标签的数量<td>

该示例是我所拥有的,但我不知道如何将其余部分放入代码中。

 $dom = new DOMDocument();
 $dom->loadHTML($text);
 $i = 0;
 foreach($dom->getElementsByTagName("td") as $node){
 //Retrieve every TD tag that have the attribute bgcolor = #0051AB
//<td bgcolor=#0051AB> NODEVALUE </td>
   if($node->getAttribute("bgcolor") == "#0051AB"){
     $cat[]= $node->nodeValue;
   }
//HERE identify every 'a' html tag that are between the $node and the next one!!
//<a href="path">nodeValue</a>


 }

例子

<table><tr><td bgcolor=#0051AB>Project 1</td></tr></table>
<a>link1</a>
other tags and text..
<a>Link 2</a>
enter code here
<table><tr><td bgcolor=#0051AB>Project 2</td></tr></table>
codecodecode
<a>link3</a>
codecodecode

我需要的结果:(0 = td nodeValue 的名称,1 = 下一个节点之前的标签数)

Array => (
   Array[0] => ([0] => Project1, [1] => 2 ),
   Array[1] => ([0] => Project2, [1] => 1 )
)

谢谢你的建议。

4

2 回答 2

3

对于这个需求,我更喜欢QueryPath ,而不是 PHP DOM;为什么?这是不同的讨论。

以下是您的问题的解决方案。

下载 QueryPath 并将其包含在您的 PHP 文件中。

require("../../QueryPath\QueryPath.php");

以下是用于解析的示例 HTML

$text="<body>
<table><tr><td bgcolor=#0051AB>Project 1</td></tr></table>
<a>link1</a>
 other tags and text..
<a>Link 2</a>
enter code here
<table><tr><td >Project 2</td></tr></table>
codecodecode
<a> Should Not Be Included</a>
codecodecode
<table><tr><td bgcolor=#0051AB>Project 2</td></tr></table>
codecodecode
<a>link3</a>
codecodecode</body>";

解析 HTML 的代码

 $tags=htmlqp($text,'body')->children();
 $isRequiredTag=false;
 $i=0;
 foreach($tags as $pr)
 {
 $tag= $pr->tag();
 if($tag=='table'){
 $isRequiredTag= (htmlqp($text,$tag)->eq($i)->find('td')-  >attr('bgcolor')=='#0051AB')?"TRUE":"FALSE";
 $i++;
 }

 if ($isRequiredTag=="TRUE" && $tag=='a') echo $pr->text();

 } 
于 2013-02-20T10:30:39.943 回答
2

简单的 HTML DOM 易于使用。

http://simplehtmldom.sourceforge.net/

foreach($html->find('td') as $td) {
       $td_value = $td->plaintext;
      foreach($td->find('a') as $anchor) {
            ...
      }
}
于 2013-02-20T18:52:55.340 回答