1

我需要一个索引页面,它显示所有 gitHub 存储库的链接。

我认为这就是为什么像Waybackmachine这样的爬虫没有找到许多 repos 的原因

我想如果有这样一个排名很高的网站,他们会开始抓取它

开发者网站 sais,有一个用于获取所有 repos 的 Api

4

1 回答 1

4

警告: GitHub 托管大量存储库。在设计索引时,您必须考虑到这一点。

我能想到几个选择:

  • 旧版 GitHub 搜索API 。不过,您将不得不应对API 速率限制
  • 这个StackOverflow 答案可能是粗略掌握每种语言的存储库数量的良好开端。
  • 利用记录公共 GitHub 时间线的GitHub Archive项目。(注意:由于该项目仅公开自 2011 年 2 月 12 日以来的事件,您将不会获得任何关于存储库的数据,显示自该日期以来没有任何活动。)
于 2013-07-02T08:41:58.303 回答