0

我正在网站上尝试获取远程页面的 Html 源(源主要由 html 表组成,每个表都有标题)

我正在使用下面的代码来获取这个远程页面的来源:

<?php
    //Get the url
    $url = "http://remotesite/pages/page1.html";
    $html = file_get_contents($url);
    $doc = new DOMDocument(); // create DOMDocument
    libxml_use_internal_errors(true);
    $doc->loadHTML($html); // load HTML you can add $html

    $elements = $doc->getElementsByTagName('tbody');

    $toRemove = array();

    // gather a list of tbodys to remove
    foreach($elements as $el)
      if((strpos($el->nodeValue, 'desktop') !== false) && !in_array($el->parentNode, $toRemove, true))
        $toRemove[] = $el->parentNode;    

            foreach($elements as $el)
      if((strpos($el->nodeValue, 'Recommended') !== false) && !in_array($el->parentNode, $toRemove, true))
        $toRemove[] = $el->parentNode;  

    // remove them
    foreach($toRemove as $tbody)
      $tbody->parentNode->removeChild($tbody);

    echo str_replace('</h3><table','<table',$doc->saveHTML());
?>

我想在单击时将每个表头作为链接打开包含此表的新页面

任何想法如何处理这个

4

0 回答 0