-2

嗨,我对屏幕抓取非常陌生。我正在尝试从酒店预订网站上抓取评论以显示在我的网站上。

我已经做到了这一点,但有点卡住了。任何人都可以帮忙吗?

<?php 
$data = file_get_contents('http://www.laterooms.com/en/hotel-reviews/238902_the-westfield-bb-sandown.aspx');
$regex = '/<div id="summary">
(.+?)</div>/';
preg_match($regex,$data,$match);
var_dump($match); 
echo $match[1];
?>
4

1 回答 1

1

使用DomDocument

<?php
  define('URL', 'http://www.laterooms.com/en/hotel-reviews/238902_the-westfield-bb-sandown.aspx');
  $doc = new DOMDocument();
  $doc->loadHTML(file_get_contents(URL));
  $summary = $doc->getElementById('summary');
  // also have $doc->getElementsByTagName , etc
  var_export($summary);
?>

此外,对于更复杂的查询,您应该考虑查看XPATH(使用类似 jQuery 的语法)

于 2012-08-14T14:50:05.240 回答