我正在尝试抓取 oracle adf faces 富客户端网页,但运气不佳,我使用 node.js 请求模块自动登录,但之后我无法通过请求访问任何其他页面。我被重定向、循环脚本卡住了,或者根本没有得到我期望的信息。
我正在使用 Wireshark 查看每个页面及其处理方式,我重新创建页面以匹配标题甚至大小,但每次框架拒绝我访问。
在你问之前,这是合法的,我没有违反任何服务条款。只是试图制作一个 web api 来加速一个过程。我已经将 phantomjs 与 casperjs 一起使用,但被卡在页面上不显示的 ajax 调用和 php curl 但使用 java 更容易。
任何建议都非常感谢。