在将其加载到 DBMS 之前,我想要一个用于大量数据库数据的源代码控制环境。我们一直在使用 GITHUB,它很棒。但他们希望存储库小于 1 GB,而我们有数百个。
它可以在 CVS 或 SVN 中,但跟踪版本很重要。数据是非常静态的,只能以低速率访问,例如每周一次访问部分数据,每月一次访问更多。
有什么建议的地方/服务可以做到这一点吗?它不一定是免费的,我们很乐意支付合理的金额。
我确认这种数据量与版本控制系统不兼容(用于记录历史,即主要是文本文件和小型二进制文件的演变)
它肯定与分布式VCS 不兼容,其中任何克隆都会克隆所有存储库。
您需要查看此类存储的云服务。
OP 抗议(downvote),指出:
它们将是普通的 ASCII,除了 GitHub 的文件大小限制如此之小,我通过 ZIP 压缩运行它们。
它们很少改变,当内容改变时,它只是文件中的一小部分行。
它正是版本控制的意义所在。哪 0.005% 的 ASCII 改变了?谁改的?什么时候?
我坚持认为:
你需要保持分开:
一个基于 Git 的系统,它提供了git-annex,使用您自己的云存储和(如果实施)git-annex 助手:请参阅它的路线图。