例如,我想从http://www.peapod.com等网站获取一些产品详细信息
我可以从搜索中获得所有简洁的产品信息。例如,在搜索“奶酪”时,我可以获得所有此类产品的重量和价格。但是,如果我想获得更详细的数据,我需要单击每个产品的链接,我可以从网络浏览器执行此操作,但是当我尝试从 html 文件执行此操作时,我得到的唯一链接信息是形成“javascript:ntn(product_id,some_int)。”
真正的 http 链接形式为http://www.peapod.com/itemDetailView.jhtml?productId=106871&NUM=1352479733231,其中第一个数字是产品 ID,第二个数字(我猜)是会话 ID。我可以通过其 JavaScript 调用从父页面中的链接地址中找到产品 id,但是如何获取会话 id?
当我尝试下载搜索页面时,我得到了一堆 js 文件,我想这些 js 文件可能会帮助我获取会话 ID。但我不知道如何调用这些 js 文件。
请帮我。非常感谢你!