出于测试目的,我试图抓取 bbc。如果向下滚动,会有一个“天气小部件”:http ://www.bbc.co.uk/
如果您键入一个城市来搜索一个电话,看起来像这样:
http://www.bbc.co.uk/wwhp?module=weather&action=search&location_term=amsterdam
单击可用城市列表后,您将从此调用中获取数据:
http://www.bbc.co.uk/wwhp?module=weather&action=set&location_id=2759794
当我抓取整个网站并填写天气小部件时,我在控制台中收到错误:
OPTIONS http://www.bbc.co.uk/wwhp?module=weather&action=search&location_term=amsterdam Origin http://mydomain.com is not allowed by Access-Control-Allow-Origin. jquery-1.4.js:23
XMLHttpRequest cannot load http://www.bbc.co.uk/wwhp?module=weather&action=search&location_term=amsterdam. Origin http://mydomain.com is not allowed by Access-Control-Allow-Origin. myproxy.php:1
当我抓取生成的网址(上面的前两个)时,我得到一个空白屏幕。我用 CURL 和简单的 html dom 抓取。为什么我不能刮掉上面的网址?我可以尝试什么?