我试图通过阻止下载 CSS/其他资源来加速 Python 中的 Selenium/PhantomJS webscraper。我只需要下载 img src 和 alt 标签。我找到了这段代码:
page.onResourceRequested = function(requestData, request) {
if ((/http:\/\/.+?\.css/gi).test(requestData['url']) || requestData['Content-Type'] == 'text/css') {
console.log('The url of the request is matching. Aborting: ' + requestData['url']);
request.abort();
}
};
如何/在哪里可以在 Python 驱动的 Selenium 中实现此代码?或者,还有其他更好的方法来阻止 CSS/其他资源下载吗?
注意:我已经找到了如何通过编辑 service_args 变量来防止图像下载:
如何在 python webdriver 中为 phantomjs/ghostdriver 设置代理?
和
在 python 上带有 Selenium 的 PhantomJS 1.8。如何阻止图像?
但是 service_args 无法帮助我处理 CSS 之类的资源。谢谢!