我正在尝试在 python 中使用 Splash for Scrapy 抓取一些动态网站。但是,我看到 Splash 在某些情况下无法等待完整页面加载。解决此问题的一种蛮力方法是添加大量wait
时间(例如,以下代码段中的 5 秒)。但是,这样做效率极低,并且仍然无法加载某些数据(有时加载内容需要超过 5 秒)。是否有某种等待元素条件可以通过这些请求?
yield SplashRequest(
url,
self.parse,
args={'wait': 5},
'User-Agent':"Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.106 Safari/537.36",
}
)