Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我正在尝试解析具有无限滚动的页面的 HTML。我想加载所有内容,以便我可以全部解析。我正在使用 Python。有什么提示吗?
这些页面使用 AJAX 更新其 html。通常你只需要找到浏览器发送的新的 AJAX 请求,猜测 AJAX url 参数的含义,然后从 API 中获取数据。
API 服务器可能会验证 AJAX 请求的用户代理、引用者、cookie、oauth_token ...,请密切关注它们。
数据是
要么提前加载
或页面在您滚动时发送请求
您可以使用httpfox查找请求并发送