123

几个月前我开始了一个项目,并将所有内容都存储在一个主目录中。在我的主目录“Project”中有几个包含不同内容的子目录: Project/paper 包含用 LaTeX 编写的文档 Project/sourcecode/RailsApp 包含我的 rails 应用程序。

“项目”是 GITified,并且在“paper”和“RailsApp”目录中都有很多提交。现在,由于我想为我的“RailsApp”使用 Cruisecontrol.rb,我想知道是否有一种方法可以在不丢失历史记录的情况下从“RailsApp”中创建一个子模块。

4

5 回答 5

128

现在有一种比手动使用 git filter-branch 更简单的方法:git subtree

安装

NOTE git-subtree现在是 1.7.11 的一部分git(如果你安装了 contrib),所以你可能已经安装了它。您可以通过执行来检查git subtree


从源代码安装 git-subtree(对于旧版本的 git):

git clone https://github.com/apenwarr/git-subtree.git

cd git-subtree
sudo rsync -a ./git-subtree.sh /usr/local/bin/git-subtree

或者,如果您想要手册页和所有

make doc
make install

用法

将较大的块拆分为较小的块:

# Go into the project root
cd ~/my-project

# Create a branch which only contains commits for the children of 'foo'
git subtree split --prefix=foo --branch=foo-only

# Remove 'foo' from the project
git rm -rf ./foo

# Create a git repo for 'foo' (assuming we already created it on github)
mkdir foo
pushd foo
git init
git remote add origin git@github.com:my-user/new-project.git
git pull ../ foo-only
git push origin -u master
popd

# Add 'foo' as a git submodule to `my-project`
git submodule add git@github.com:my-user/new-project.git foo

有关详细文档(手册页),请阅读git-subtree.txt.

于 2009-08-20T18:22:10.333 回答
41

结帐git filter-branch

手册页的Examples部分显示了如何将子目录提取到它自己的项目中,同时保留它的所有历史记录并丢弃其他文件/目录的历史记录(正是您要查找的内容)。

要重写存储库,使其看起来好像foodir/是其项目根目录,并丢弃所有其他历史记录:

   git filter-branch --subdirectory-filter foodir -- --all

因此,例如,您可以将库子目录转换为它自己的存储库。
请注意将选项与修订选项分开,以及--重写所有分支和标签。filter-branch--all

于 2009-05-30T17:28:55.003 回答
13

这样做的一种方法是相反的 - 删除除您要保留的文件之外的所有内容。

基本上,制作存储库的副本,然后用于git filter-branch删除除要保留的文件/文件夹之外的所有内容。

例如,我有一个项目,我希望从中提取文件tvnamer.py到一个新的存储库:

git filter-branch --tree-filter 'for f in *; do if [ $f != "tvnamer.py" ]; then rm -rf $f; fi; done' HEAD

这用于git filter-branch --tree-filter完成每个提交,运行命令并重新提交生成的目录内容。这是极具破坏性的(因此您应该只在存储库的副本上执行此操作!),并且可能需要一段时间(在具有 300 个提交和大约 20 个文件的存储库上大约需要 1 分钟)

上面的命令只是在每个修订版上运行以下 shell 脚本,您当然必须修改它(使其排除您的子目录而不是tvnamer.py):

for f in *; do
    if [ $f != "tvnamer.py" ]; then
        rm -rf $f;
    fi;
done

最大的明显问题是它会留下所有提交消息,即使它们与剩余文件无关。脚本git-remove-empty-commits修复了这个..

git filter-branch --commit-filter 'if [ z$1 = z`git rev-parse $3^{tree}` ]; then skip_commit "$@"; else git commit-tree "$@"; fi'

您需要使用-fforce 参数filter-branch再次运行任何内容refs/original/(基本上是备份)

当然,这永远不会是完美的,例如,如果您的提交消息提到其他文件,但它大约是 git 当前允许的(据我所知)。

同样,只在您的存储库的副本上运行它!- 但总而言之,要删除除“thisismyfilename.txt”以外的所有文件:

git filter-branch --tree-filter 'for f in *; do if [ $f != "thisismyfilename.txt" ]; then rm -rf $f; fi; done' HEAD
git filter-branch -f --commit-filter 'if [ z$1 = z`git rev-parse $3^{tree}` ]; then skip_commit "$@"; else git commit-tree "$@"; fi'
于 2009-05-30T18:29:23.333 回答
4

CoolAJ86和apenwarr答案都非常相似。我在两者之间来回走动,试图理解其中任何一个都缺少的部分。下面是它们的组合。

首先将 Git Bash 导航到要拆分的 git repo 的根目录。在我的例子中~/Documents/OriginalRepo (master)

# move the folder at prefix to a new branch
git subtree split --prefix=SubFolderName/FolderToBeNewRepo --branch=to-be-new-repo

# create a new repository out of the newly made branch
mkdir ~/Documents/NewRepo
pushd ~/Documents/NewRepo
git init
git pull ~/Documents/OriginalRepo to-be-new-repo

# upload the new repository to a place that should be referenced for submodules
git remote add origin git@github.com:myUsername/newRepo.git
git push -u origin master
popd

# replace the folder with a submodule
git rm -rf ./SubFolderName/FolderToBeNewRepo
git submodule add git@github.com:myUsername/newRepo.git SubFolderName/FolderToBeNewRepo
git branch --delete --force to-be-new-repo

下面是上面的副本,其中替换了可自定义的名称并使用 https 代替。根文件夹现在是~/Documents/_Shawn/UnityProjects/SoProject (master)

# move the folder at prefix to a new branch
git subtree split --prefix=Assets/SoArchitecture --branch=so-package

# create a new repository out of the newly made branch
mkdir ~/Documents/_Shawn/UnityProjects/SoArchitecture
pushd ~/Documents/_Shawn/UnityProjects/SoArchitecture
git init
git pull ~/Documents/_Shawn/UnityProjects/SoProject so-package

# upload the new repository to a place that should be referenced for submodules
git remote add origin https://github.com/Feddas/SoArchitecture.git
git push -u origin master
popd

# replace the folder with a submodule
git rm -rf ./Assets/SoArchitecture
git submodule add https://github.com/Feddas/SoArchitecture.git
git branch --delete --force so-package
于 2019-02-18T20:28:42.147 回答
3

如果您想将某些文件子集传输到新的存储库但保留历史记录,那么您基本上会得到一个全新的历史记录。这将工作的方式基本上如下:

  1. 创建新的存储库。
  2. 对于旧存储库的每个修订,将对模块的更改合并到新存储库中。这将创建您现有项目历史的“副本”。

如果您不介意编写一个小而多毛的脚本,那么自动化它应该有点简单。直截了当,是的,但也很痛苦。人们过去在 Git 中做过历史重写,你可以搜索一下。

或者:克隆存储库,并删除克隆中的论文,删除原始中的应用程序。这将需要一分钟,它可以保证工作,而且你可以回到比试图净化你的 git 历史更重要的事情上。并且不用担心冗余历史副本占用的硬盘空间。

于 2009-05-28T10:29:55.603 回答