111

可能重复:
如何从 Git 的提交历史中清除一个大文件?

我做了一件愚蠢的事。想象一下,我提交了一个 100MB 的文件。然后我看到这个并删除这个文件并再次提交。这是删除文件的正常过程。

但是现在副作用是我的历史很重,因为它保存了这个大文件(我相信这就是它很重的原因)。我只使用本地 git,所以我不在任何服务器上同步。

如何明确删除此文件并节省磁盘空间?

4

3 回答 3

213

您可以使用 gitfilter-branch命令执行此操作,如下所示:

git filter-branch --index-filter "git rm -rf --cached --ignore-unmatch path_to_file" HEAD

您可以在此处找到更多文档http://dalibornasevic.com/posts/2-permanently-remove-files-and-folders-from-a-git-repository

于 2011-11-10T17:00:44.587 回答
27

您要查找的命令是filter-branch. 它允许您从登记中永久删除文件。这个博客有一个关于如何从存储库中删除有问题的文件的很棒的教程

于 2011-11-10T17:00:11.840 回答
20

你可以从David Underhill那里获取这个很棒的脚本来从 git 存储库中删除文件:

#!/bin/bash
set -o errexit

# Author: David Underhill
# Script to permanently delete files/folders from your git repository.  To use 
# it, cd to your repository's root and then run the script with a list of paths
# you want to delete, e.g., git-delete-history path1 path2

if [ $# -eq 0 ]; then
    exit 0
fi

# make sure we're at the root of git repo
if [ ! -d .git ]; then
    echo "Error: must run this script from the root of a git repository"
    exit 1
fi

# remove all paths passed as arguments from the history of the repo
files=$@
git filter-branch --index-filter "git rm -rf --cached --ignore-unmatch $files" HEAD

# remove the temporary history git-filter-branch otherwise leaves behind for a long time
rm -rf .git/refs/original/ && git reflog expire --all &&  git gc --aggressive --prune
于 2011-11-10T16:58:41.897 回答