0

我正在使用简单的 HTML dom 来抓取抓取的数据,并且运行良好。但是,我拥有的源之一没有任何唯一字段,因此我尝试 str_replace,然后获取已重命名的元素,然后使用 simple_html_dom。

但是,它不起作用。我的代码是:

require('simple_html_dom.php');

// Create DOM from URL or file
$html = file_get_html('http://www.url.com');

$html = str_replace('<strong>','',$html);

$html = str_replace('</strong>','',$html);   

$html = str_replace('<span class="pound">&pound;</span>','',$html);

$html = str_replace('<td>','<td class="myclass">',$html);

foreach($html->find('td.myclass') as $element)
   $price = $element->innertext;

$price = preg_replace('/[^(\x20-\x7F)]*/','', $price);

echo $price;
4

1 回答 1

0

尝试

<?php
  require('simple_html_dom.php');
  // Create DOM from URL or file
  $html = file_get_html( 'http://www.url.com' );

  foreach( $html->find( 'td' ) as $element ) {
    $price  = trim( str_replace( "&pound;", "", $element->plaintext ) );
  }

  $price = preg_replace('/[^(\x20-\x7F)]*/','', $price);

  echo $price;
?>
于 2013-07-06T20:53:45.160 回答