1

需要帮助使用Simple HTML DOM Parser遍历 DOM 树。如果有人可以花点时间看看它是如何工作的,那么如果我弄明白了,知识渊博的 PHP 编码人员应该很快就能弄明白。我被困的地方是从我朋友的俄罗斯篮球网站上的一个 div 中获取文章。例如,博客 div 如下所示:

<div id='columnsList'><div class='item'>
  <div class='title'><a href='/ru/columns/1'>Колонка Римантаса Григаса</a></div>
  <div class='img'> <img src='/files/columns/grigas.jpg'></div>
  <div class='news'>
    <a href='/ru/news/3174'>Римантас Григас: о пути на Евробаскет (0)</a>
    <a href='/ru/news/1486'>Римантас Григас: об уходе из УГМК и о ближайших планах (1)</a>
    <a href='/ru/news/731'>О горниле «Финала восьми» Евролиги (0)</a>
    <a href='/ru/news/421'>О новом назначении и о сборной Украины (0)</a>
    <a href='/ru/news/299'>О настоящем примере для подражания (0)</a>
  </div><div style='clear:left;'></div> 
  </div>
  <div class='item'>
  <div class='title'><a href='/ru/columns/2'>Колонка Кирилла Натяжко</a></div>
  <div class='img'> <img src='/files/columns/nati.jpg'> </div>
  <div class='news'>
    <a href='/ru/news/3618'>Кирилл Натяжко: "Хорватов мы не боимся" (2)</a>
    <a href='/ru/news/3113'>Кирилл Натяжко: "Необоснованная критика подарила мне дополнительную мотивацию" (1)</a>
    <a href='/ru/news/2454'>Кирилл Натяжко: "Мне нечего бояться, пускай лучше боятся меня!" (6)</a>
    <a href='/ru/news/325'>Доброе утро, страна! (1)</a>
  </div><div style='clear:left;'></div> 
</div>
<div class='news'>
//More divs and links

这就是我可以拉出单个“a”链接并显示它们的方法,但我想要做的是获取所有这些链接的 div 标题,基本上是对它们进行分类,而不是把所有的东西都排成一排。我无法弄清楚如何在 foreach 循环中做到这一点。

foreach ($html->find('div[class=item] a[href*=news]') as $col){
   echo $col.'<br>';
}

我尝试与第一个回声一起添加:

echo $col->parent()->prev_sibling()->prev_sibling()->a;

那应该回到 div 'news',然后再到 div 'img' 再到 div 'title'。那应该得到第一个 div=title 的链接。但我什么也得不到。有没有办法做到这一点?

4

2 回答 2

2

尝试这个:

$output = array();
foreach($html->find('div[class=item]' as $item) {
   $title = $item->find('div[class=title] a', 0)->innertext;
   $output[$title] = array();
   foreach($item->find('div[class=news] a') as $link) {
       $output[$title][] = $link->innertext;
   }
}
于 2013-03-20T14:35:40.917 回答
0

这是不使用数组的方法!

foreach ($html->find('div[class=item]') as $item){
    echo $item->children(0)->plaintext;
    foreach ($item->find('a[href*=news]') as $col){
      echo $col.'<br>';
    }
}

得到了想要的结果!

于 2013-03-20T15:07:46.827 回答