3

我写了一个网络爬虫脚本代码是::

<?php
include_once('simple_html_dom.php');
$target_url = "http://jvlaunchcalendar.com/calendar/";
$html = new simple_html_dom();
$html->load_file($target_url);
$ret = $html->find('div[class=fc-event-inner'); 
//to print the caleder events similar code //works for other sites like flipcat.com
foreach($ret as $post)
{
    echo $post.'<br />';
}
echo $html;// to print the calender of jvlaunchcalendar.com site
?>

此脚本适用于其他站点。但我想要http://jvlaunchcalendar.com/calendar/页面的所有日历事件,但这个脚本不显示任何事件给空日历。请帮我获取日历的事件。

问候。

4

1 回答 1

3

当您尝试时,$html->load_file($target_url);您会得到没有事件的空白页面,因为事件是用 ajax 加载的。

获取事件的简单解决方案:跟踪 ajax url 调用并加载它,而不是页面。(我检查过,它返回json数据,一切正常)。

但这并不好。其他方式 - 在 WordPress 中使用本机日历功能进行操作。

于 2012-12-14T08:10:35.210 回答