我有需要从 git 历史记录中删除许多文档文件的情况,例如 *.html 文件
这些 HTML 文件经过多年的开发,导致 git repo 变得臃肿。现在每次都很难检查 10 多个 GB。
我能够使用在互联网上找到的脚本找出哪些文件格式是导致这种膨胀的原因,例如
git rev-list --objects --all |
git cat-file --batch-check='%(objecttype) %(objectname) %(objectsize) %(rest)' |
sed -n 's/^blob //p' |
sort --numeric-sort --key=2 |
cut -c 1-12,41- |
$(command -v gnumfmt || echo numfmt) --field=2 --to=iec-i --suffix=B --padding=7 --round=nearest**
使用 grep 分离文档文件格式。我走到了死胡同。