1

我想用来file_get_contents只抓取 p 标签之间的信息。

我尝试使用 DOM 元素,但是当我使用getElementByTagName并循环遍历数组时,它会删除<p>标记中的所有 HTML。

<?php
function search(){
    $city = $_POST['city'];
    $scity = trim($city);
    $dom = new DOMDocument;
    libxml_use_internal_errors(true);

    $dom->loadHTMLFile('http://'.$scity.'.craigslist.org/search/cto?query=Toyota');
    libxml_use_internal_errors(false);
    $xpath = new DOMXPath($dom);
    $contents = $xpath->query('//p[@class="row"]');

    foreach($contents as $val){
        echo '<a href="' . $val->getElementsByTagName('a')->getAttribute('href') . '">' .  utf8_decode(trim($val->nodeValue, " -,")) . "</a><br />\n";;
    }
}
?>

我希望它像在 craigslist 上一样显示。带有 craigslist 和价格、img 等链接的标题...

4

1 回答 1

0

使用preg_match_all()

$text = file_get_contents("....");

preg_match_all('|<p>(.*?)</p>|',$texst, $matches); //Use regex to match all inside `p`

var_dump($matches); //View the matches
于 2012-10-18T06:19:17.113 回答