我们目前面临一个奇怪的情况,一个只有 65MB 的本地克隆存储库在服务器上(GitBlit,但这不重要),大小为 12GB。我尝试了不同的想法,这里可能会出错,这里是列表:
git ls-tree -r -t -l --full-name HEAD > stats.txt
为服务器上的每个分支完成,并收集该信息。cut -c53-60 <filename> | grep -v '-' | awk '{ sum += $1 } END { print sum }'
用do 总结所有提交的所有文件大小来分析结果。- 结果我们得到了 ~ 150 MB
所以我们没有发现任何包含大文件的提交。
我的本地目录.git/objects/pack
有一个当前 17MB 的包文件(在 GC 之后,之前是 21MB)。服务器上的包文件当前大小为 12 GB。
我已经以正常方式克隆了存储库:git clone https://myserver.mycompancy.com/gitblit/r/projectID/projectID.git
并获得了本地副本。可以肯定的是,我当时git fetch --all
没有改变。
那么我们可以做些什么来找到服务器上的包文件大得多的原因呢?GitBlit 有一个自动 GC 运行,它将打包超过 7 天的松散对象。
更新:我已按照建议在git verify-pack -v
本地克隆和服务器上执行命令,以下是结果(仅作为统计数据):
- 结果行
- 本地:60,156
- 服务器:16,456,844
因此,服务器上的包文件要长一个数量级(约 270 倍),这仅说明了包中的差异。下一步应该如何找到更多行的原因?统计数据的某些方面是否更有趣?