0

我正在尝试在我的网站中实现 PHP 爬虫。我的主要动机是从其他网站获取产品的价格。为此,我正在尝试使用 dom 解析器,但我的脚本无法正常工作。我用于解析类为 prc 的 div 的代码是:-

<?php
include('simplehtmldom/simple_html_dom.php');
$html = file_get_html('http://www.ebay.in');
$html->find('div', 1)->class = 'prc';   
        echo $html;      
?>
4

1 回答 1

0

也许这会有所帮助(顺便说一下,它不需要 SimpleHTMLDom):

$className = 'prc'; // Name of the class

$domDocument = new DOMDocument('1.0');
@$domDocument->loadHTMLFile('http://www.ebay.in');
$domXPath = new DOMXPath($domDocument);

// Obtain all elements with the specified class name
$prcs = $domXPath->query(
    "//*[contains(concat(' ', normalize-space(@class), ' '), ' $className ')]"
);

for ($i = 0; $i < $prcs->length; $i++) {
    // For each item found, store it in $result
    $result[] = $prcs->item($i)->firstChild->nodeValue;
}

// Display results
print_r($result);
于 2013-08-19T05:20:15.633 回答