GitHub 存档项目 状态
GitHub Archive 是一个记录公共 GitHub 时间线、将其存档并使其易于访问以进行进一步分析的项目。
该档案也可通过Google Big Query进行查询。但是,看起来我要么遗漏了某些东西,要么只有一部分数据可用。
事实上,运行以下查询只返回1636
WatchEvents(started或stopped),而Rails 存储库的帐户比14300
观察者更多。
SELECT actor_attributes_login, created_at, payload_action
FROM [githubarchive:github.timeline]
where repository_name = "rails"
and type="WatchEvent"
order by created_at asc;
看起来最早检索到的数据大约有 2.5 个月的历史。
数据会被截断吗(这对于存档来说可能看起来很奇怪)?是否存在与使用 BigQuery 相关的限制/配额?