我已经拥有的抓取代码不起作用,所以我搜索并发现我需要使用 DOM,即使在阅读之后我也不确定如何实现我已经拥有的 DOM。我担心弄坏东西。非常感谢任何帮助/教程。
// get input
$link = post('link1');
$category = post('category');
$time = post('time');
// markers
$findme1 = 'https://www.mturk.com/mturk/preview?groupId=';
$findme2 = '<span class="reward">';
$findme3 = '</span>';
// check if link is correct
$rightlink = strpos($link, $findme1);
// if link is correct
if ($rightlink !== false)
{
// get html from link
$html = file($link);
// iterate through html
foreach ($html as $i => $line)
{
// set title
if($i == 640) $title = htmlentities($line);
// set requester
if($i==669) $requester = htmlentities($line);
if($i==678)
{
// modify the line and save as reward
$line_modified = str_replace($findme2, '', $line);
$line_modified = str_replace($findme3, '', $line_modified);
$reward = htmlentities($line_modified);
}
// set qualifications
if($i==711) $q = htmlentities($line);
}