我正在使用简单的 HTML dom 来抓取抓取的数据,并且运行良好。但是,我拥有的源之一没有任何唯一字段,因此我尝试 str_replace,然后获取已重命名的元素,然后使用 simple_html_dom。
但是,它不起作用。我的代码是:
require('simple_html_dom.php');
// Create DOM from URL or file
$html = file_get_html('http://www.url.com');
$html = str_replace('<strong>','',$html);
$html = str_replace('</strong>','',$html);
$html = str_replace('<span class="pound">£</span>','',$html);
$html = str_replace('<td>','<td class="myclass">',$html);
foreach($html->find('td.myclass') as $element)
$price = $element->innertext;
$price = preg_replace('/[^(\x20-\x7F)]*/','', $price);
echo $price;