0

我喜欢从网页中访问一些数据,这些网页的排列方式类似于 android 应用程序中的目录/商店。

举个具体的例子:这是马克吐温书籍上亚马逊列表的 URL:

http://www.amazon.com/s/ref=nb_sb_noss/180-5768314-5501168?url=search-alias%3Daps&field-keywords=mark+tain&x=0&y=0#/ref=nb_sb_noss_1?url=search-alias %3Daps&field-keywords=mark+twain&rh=i%3Aaps%2Ck%3Amark+twain

1)如果我有上面的 URL,我如何获得例如

  • 条目数和
  • 对于每个条目,带有标题的行(可能还有图像)?其中可能包括如何遍历所有后续页面并访问每个条目。

最好的(正确+兼容+有效)方法是什么?我的印象是 jquery 可能有用。但到目前为止,我对 HTML 和 Javascript 的了解还只是基本的。

2)如何查询马克吐温所有书籍的网址?

3)对于这个和类似的主题有什么建议的读物吗?

感谢您的宝贵时间,祝您有美好的一天!

托马斯

4

1 回答 1

2

建议您不要“屏幕抓取”其他网站。除了难以维护(随着网站的变化等) - 这实际上违反了许多网站的使用/服务条款(TOS)。

相反,请查看所需的网站是否提供您可以使用的 Web 服务。这些将以更易使用的格式返回数据,例如 JSON 或 XML。您通常还会获得自己的开发人员密钥(用于跟踪请求),以及其他可能的功能,如果直接针对 HTML,您将无法获得这些功能。

尤其是亚马逊,肯定会提供这个。有关详细信息,请参阅https://affiliate-program.amazon.com/gp/advertising/api/detail/main.html。(不要被“广告”的命名所迷惑。)

于 2012-01-22T02:42:22.820 回答