1

我想<td valign="top" class="notizia_testo"></td>从这个 url中获取文本

http://www.ladige.it/news/2008_lay_notizia_01.php?id_cat=4&id_news=100152

我尝试了simple html domand php regular-expression,但没有返回。我检查了 html 原始代码,并将它们复制为:

<?php
$str = <<<EOT
//all the html raw code
EOT;
preg_match_all("|<td valign=\"top\" class=\"notizia_testo\">([^^]*?)</td>|u", $str, $matches1);
print_r($matches1);
?>

我终于发现故障可能是由于:

line 762     <!?php include($_SERVER["DOCUMENT_ROOT"]."/include/adv/manzoni_bigrect.php"); ?>

如何通过这条线并为我工作?谢谢。

4

1 回答 1

4

您可以通过简单地使用simple_html_dom来获得结果,如下所示,

    require 'simplehtmldom/simple_html_dom.php'; 

    $data = file_get_contents('http://www.ladige.it/news/2008_lay_notizia_01.php?id_cat=4&id_news=100152');
    $oHTML = str_get_html($data);
    $oTDs = $oHTML->find('table tr td.notizia_testo');
    $result = array();
    foreach($oTDs as $oTD) {
        $result[] = trim($oTD->plaintext);
    }
    echo "<pre>";
    var_dump($result);
    echo "</pre>";
于 2011-03-14T10:44:59.327 回答