3

我有兴趣获取特定语言集的 github repos 计数(如果可能,请使用历史数据。)

以下是我尝试自己开始收集统计数据的事情:

  1. 屏幕抓取页面,如:

https://github.com/search?q=language%3Aperl&type=&ref=simplesearch

  1. 使用 github API:

https://api.github.com/legacy/repos/search/KEYWORD?language=perl

但不幸的是,这似乎需要一个 KEYWORD 才能获得任何结果。此外,我只需要计数而不是每个 repo 上的元数据。

我也对历史数据感兴趣,而且似乎这些统计数据可能已经在某处可用。

关于通过语言和/或历史数据获取回购计数的更好方法的任何想法?

4

1 回答 1

4

你可以试试这个: https ://api.github.com/search/repositories?q=language:Python

此外,您可以查询github 存档。使用大查询接口,查询应该是:

bq query 'SELECT repository_language, count(repository_language) as pushes
FROM [githubarchive:github.timeline]
WHERE type="CreateEvent" and repository_fork == "false"
GROUP BY repository_language
ORDER BY pushes DESC'

此查询生成每种语言的存储库数量的统计信息。

于 2014-04-12T00:07:32.563 回答