0

例如,我想从http://www.peapod.com等网站获取一些产品详细信息

我可以从搜索中获得所有简洁的产品信息。例如,在搜索“奶酪”时,我可以获得所有此类产品的重量和价格。但是,如果我想获得更详细的数据,我需要单击每个产品的链接,我可以从网络浏览器执行此操作,但是当我尝试从 html 文件执行此操作时,我得到的唯一链接信息是形成“javascript:ntn(product_id,some_int)。”

真正的 http 链接形式为http://www.peapod.com/itemDetailView.jhtml?productId=106871&NUM=1352479733231,其中第一个数字是产品 ID,第二个数字(我猜)是会话 ID。我可以通过其 JavaScript 调用从父页面中的链接地址中找到产品 id,但是如何获取会话 id?

当我尝试下载搜索页面时,我得到了一堆 js 文件,我想这些 js 文件可能会帮助我获取会话 ID。但我不知道如何调用这些 js 文件。

请帮我。非常感谢你!

4

1 回答 1

0

与其尝试编写一些东西来调用 JavaScript 函数,不如使用 Fiddler 之类的工具来查看单击这些链接时会发生什么。最有可能的是,这些函数所做的是发出一个 HTTP 请求来检索要显示的数据。您的应用程序会更容易发出相同的 HTTP 请求并提取数据,而不是使用屏幕抓取技术。

于 2012-11-09T17:02:08.263 回答