我正在编写一个爬网脚本来读取网上商店的评级。
curl 部分现在给我带来了麻烦,因为它没有检索到正确的内容。
我使用 ajax 脚本从数据库中分批选择 url。我为 curl 提供了带有评分的页面的正确 url,但 Curl 正在检索没有 url 中可变部分的页面。
这是我传递给 Curl 的 url:$actualurl
(这是我想从中读取所有 6 个评级 (Produktbewertungen) 的页面。)
但是通过 curl 调用,我从这个页面获取内容,这与没有 viewAction 的情况相同,我回显了输出
我的 Curl 调用如下所示:
$ch = curl_init();
curl_setopt($ch, CURLOPT_TIMEOUT, 30);
curl_setopt($ch, CURLOPT_USERAGENT, $agent);
curl_setopt($ch, CURLOPT_RETURNTRANSFER,1);
curl_setopt($ch, CURLOPT_URL, $actualurl);
//read content of $url
$result = curl_exec ($ch);
curl_close ($ch);
为什么 Curl 会忽略 url 的最后一部分(带有&ViewAction=ViewProductRating
)
非常感谢,我还是 curl 的新手!
编辑
我从 4 个部分构建了上面提到的 url。零件如下:
$domainroot: http://www.domain.com/
$objectpath: epages/xxx.sf/de_DE/?ObjectPath
$ratingurl: %3D%2FShops%2F15456062%2FProducts%2F%2522Briefkastenst%25C3%25A4nder%2520Bobiround%2522%2FSubProducts%2F%2522Briefkastenst%25C3%25A4nder%2520Bobiround%2520gr%25C3%25BCn%2520RAL6005%2522%26amp%3B
$viewratings: ViewAction=ViewProductRating
最后我将它们链接在一起:
$actualurl = $domainroot.$objectpath.$ratingurl.$viewratings;