我需要抓取此页面(广告):https ://www.sahbinden.com/en/cars/used?date=1day&a5_min=2005&a5_max=2020
当我打开它太多次时,我会被阻止,更改 IP 也无济于事。问题是当我从我的电脑上的浏览器打开这个页面时,它工作得很好。但它似乎被 webkit 阻止了。
await page.route("**/*", (route) => {
if (!firstReq) route.continue();
else {
firstReq = false;
route.continue({
method: method,
postData: data,
headers: headers,
});
}
});
let pageRes = await page.goto(url);
await page.waitForNavigation()
await page.unroute("**/*");
return pageRes;
我意识到这是试图阻止机器人的网站,但有哪些做法可以避免这种情况。我尝试过等待、ip 轮换以及 useragent 轮换 - 似乎没有任何效果