6

我正在开展一个项目,该项目需要可靠地访问网站当前提要中不一定可用的历史提要条目。我找到了几种访问此类数据的方法,但没有一种方法能够提供我需要的所有特征。

将其视为一场头脑风暴。我会告诉你我发现了多少,如果你有任何其他想法,你可以贡献。

  1. Google AJAX Feed API - 将您限制为 250 个项目

  2. Unofficial Google Reader API - 完美但非官方,因此不可靠(也许是准非法的?)。此外,身份验证似乎很棘手。

  3. Spinn3r - 花费很多钱

  4. 在提要的网站上搜索互联网档案- 非常复杂,覆盖范围参差不齐,只能在不得已的情况下使用

  5. 雅虎!Feed APIYahoo! Search BOSS - 第一个看起来更像是一个聚合器,这意味着我需要为每个提要进行不同的注册,第二个应该提供对雅虎数据的更多访问权限,但我找不到提要。

  6. (感谢 Lou Franco)Bloglines Sync API - 除了需要一个帐户和被设计成一个聚合器的问题之外,它没有办法向帐户添加提要。因此,无需检索任意提要。您需要先通过阅读器手动添加它们。

  7. 其他搜索引擎/博客搜索/什么的?

这是一个非常令人恼火的问题,因为我们所讨论的语义信息曾经存在,但(通常)仍然有效,但难以可靠、自由且不受限制地访问。有人知道饲料进入好处的任何替代来源吗?

4

2 回答 2

1

Bloglines 有一个用于同步帐户的 API

http://www.bloglines.com/services/api/sync

您必须创建一个帐户,订阅您要下载的提要,然后您可以根据日期下载,这可能是过去的方式。不确定条款。

于 2008-10-03T17:16:58.080 回答
1

到目前为止,我找到的最佳答案是:Google 阅读器的非官方 API 为他们的提要提供了一个公共访问点,这意味着不需要身份验证。使用如下:

http://www.google.com/reader/public/atom/feed/ {您的提要 uri 在这里}?n=1000

用您感兴趣的提要 URI 替换 squigglies(包括 squigglies 本身)中的文本。有关精确参数的更多信息可以在这里找到:

http://blog.martindoms.com/2009/10/16/using-the-google-reader-api-part-2/

但如果您不想弄乱身份验证,请记住使用 /public/ url

于 2011-04-29T09:02:49.947 回答