我正在使用 Apify 并且爬行速度非常可怕。我需要浏览大约 12,500 页的房产列表。
起始页: https ://www.sreality.cz/hledani/prodej/byty?strana=1
链接选择器:a[href]
伪 URL: https://www.sreality.cz/detail/prodej/byt/[.+]/[.+]/[.+] https://www.sreality.cz/hledani/prodej/byty?斯特拉纳=[.+]
第一个是公寓的细节 第二个是下一页
我的页面功能:
异步函数 pageFunction(context) {
const { request, log, skipLinks, jQuery: $, waitFor } = context;
const pageTitle = $('title').first().text();
context.log.info(`URL: ${context.request.url}, TITLE: ${pageTitle}`);
if (request.userData.label === 'DETAIL') {
return {
url: context.request.url,
pageTitle,
name: $('span.name.ng-binding').eq(3).text(),
};
}
}
现在我只是在刮名字。我想先解决速度。
感谢您的任何答案:)