我最近开始使用 Web-Harvest 作为网络抓取工具。目前,我正在一个项目的开始工作,我想验证/登录到一个网站。在开始之前,我想明确一下代码中的 [URL] 替换了网页的实际 url。
所以,我试图通过执行以下配置来发布登录信息:
<config>
<var-def name="result">
<http method="post" url="[URL]/webreservations/WebObjects/WebReservations.woa/wa/Login?language=1&server=1" multipart="true">
<http-param name="login">[myusername]</http-param>
<http-param name="password">[mypassword]</http-param>
</http>
</var-def>
</config>
如何检索结果信息并遵循重定向?手动登录时,以下扩展名将添加到 URL。似乎有某种随机化以及添加的会话 ID。我想这是我需要在我的解决方案中加入的东西?
[URL]/nP8oIdbhk8MTXkrQ7Y2Z1g/0.3.0;jsessionid=2EF81CDA9A2EFF0B14E45889BC279BFA
以下是页面来源的一部分,这可能是问题的关键。这是一个 WebObjects 问题吗?这是一个javascript问题吗?我是问题吗?:)
<body onload="document.form.login.focus();">
<form name="form" onsubmit="showDiv();return true;" method="post" action="/webreservations/WebObjects/WebReservations.woa/wa/Login">
...
</form>
</body>
任何帮助是极大的赞赏。