我想在 Quora 上的一个问题下收集每个答案的文本、日期和其他一些属性。我的计划是在 Python 上发出请求并使用 BeautifulSoup 解析返回的 HTML。然而,当我在 Python 上提交 GET 请求时,返回的对象只包含 10 个答案,而实际的答案数量超过 10 个。我知道在浏览器上,您向下滚动以加载更多答案。幕后似乎发生的是,您提交了一个 POST 请求,该请求将以 json 对象的形式返回更多答案。请参阅下面的屏幕截图。
但是,当我使用与屏幕截图中相同的 URL 提交 POST 请求时,我收到了错误请求(状态代码 400)。似乎很难实现一个可行的解决方案,它可以迭代地检索所有答案(而不仅仅是前 10 个答案)。
任何帮助或建议将不胜感激。