0

你好。我正在写简单的机器人。Bot 应该使用 curl 从所有页面中抓取数据。一开始,Bot 只知道第一个子页面 $start 的 url。从第一页机器人抓取数据后,获取数据的第一部分和下一个子页面的 url 来抓取 $rip['next']。当抓取的子页面没有下一个 url 跟随时,机器人应该停止工作 $rip['next'] = null

下面的代码只打印第一个子页面数据,没有别的。我搞砸了什么吗?我的新手大脑需要休息。任何人?

goto a;
a: //first page
$rip = rip_album_single_subpage($start);
print_r( $rip['data']);
goto b;

b: //pages
$rip = rip_album_single_subpage($rip['next']);
print_r( $rip['data']);
if($rip['next']){
    goto b;
}else{
    goto c;
}
c: //last
$rip = rip_album_single_subpage($rip['next']);
print_r( $rip['data']);
echo 'done';
4

0 回答 0