我有大约 500,000 个文本文件,大部分在 10 KB 到 200KB 左右(一些特定的文件可能高达 10MB 左右),总大小约为 3GB。
我想知道 git 管理这么多文件的性能如何?人们是否曾经主持过如此规模的回购?
如果 Web 界面像 GitHub 一样提供,并且支持在线编辑文件,那么提交更改需要很长时间吗?当人们将更改推送到服务器时它会阻塞吗?
git 是否需要特定的设置才能在服务器上运行良好?
我有大约 500,000 个文本文件,大部分在 10 KB 到 200KB 左右(一些特定的文件可能高达 10MB 左右),总大小约为 3GB。
我想知道 git 管理这么多文件的性能如何?人们是否曾经主持过如此规模的回购?
如果 Web 界面像 GitHub 一样提供,并且支持在线编辑文件,那么提交更改需要很长时间吗?当人们将更改推送到服务器时它会阻塞吗?
git 是否需要特定的设置才能在服务器上运行良好?
正如我在“ Git 中的文件限制是什么(数量和大小)? ”和“带有大文件的 git ”中提到的,git 不适合大型 repo。
大量文件可以工作(只要您在初始导入之后一次不更改/添加太多文件)
但是由于包文件索引 (.idx) 文件结构以及在这些索引中查找特定文件的成本,大尺寸是有问题的。
另外,如果您尝试在其服务器上存储大量存储库,GitHub 可能会强制执行其软限制配额。
最好将该存储库拆分为一组连贯的较小存储库(您仍然可以通过子模块将其组合为一个)