0

我最近开始使用 Web-Harvest 作为网络抓取工具。目前,我正在一个项目的开始工作,我想验证/登录到一个网站。在开始之前,我想明确一下代码中的 [URL] 替换了网页的实际 url。

所以,我试图通过执行以下配置来发布登录信息:

<config>
    <var-def name="result"> 
        <http method="post" url="[URL]/webreservations/WebObjects/WebReservations.woa/wa/Login?language=1&amp;server=1" multipart="true"> 
        <http-param name="login">[myusername]</http-param>
        <http-param name="password">[mypassword]</http-param>
    </http>
</var-def>
</config>

如何检索结果信息并遵循重定向?手动登录时,以下扩展名将添加到 URL。似乎有某种随机化以及添加的会话 ID。我想这是我需要在我的解决方案中加入的东西?

[URL]/nP8oIdbhk8MTXkrQ7Y2Z1g/0.3.0;jsessionid=2EF81CDA9A2EFF0B14E45889BC279BFA

以下是页面来源的一部分,这可能是问题的关键。这是一个 WebObjects 问题吗?这是一个javascript问题吗?我是问题吗?:)

<body onload="document.form.login.focus();">
   <form name="form" onsubmit="showDiv();return true;" method="post" action="/webreservations/WebObjects/WebReservations.woa/wa/Login">
...
</form>
</body>

任何帮助是极大的赞赏。

4

1 回答 1

0

确保您已获得所有必要的登录参数。它可能需要的不仅仅是密码和用户名。

于 2012-06-02T14:01:18.307 回答