1889

我有一个Git存储库,其中包含许多子目录。现在我发现其中一个子目录与另一个无关,应该分离到一个单独的存储库。

如何在将文件历史记录保留在子目录中的同时做到这一点?

我想我可以制作一个克隆并删除每个克隆的不需要的部分,但我想这会在检查旧版本等时给我完整的树。这可能是可以接受的,但我更愿意假装两个存储库没有共享历史记录。

为了清楚起见,我有以下结构:

XYZ/
    .git/
    XY1/
    ABC/
    XY2/

但我想要这个:

XYZ/
    .git/
    XY1/
    XY2/
ABC/
    .git/
    ABC/
4

26 回答 26

1503

The Easy Way™</h1>

事实证明,这是一种常见且有用的做法,Git 的霸主们让它变得非常容易,但你必须拥有更新版本的 Git (>= 1.7.11 May 2012)。有关如何安装最新 Git 的信息,请参阅附录。此外,下面的演练中有一个真实的示例

  1. 准备旧仓库

     cd <big-repo>
     git subtree split -P <name-of-folder> -b <name-of-new-branch>
    

注意: <name-of-folder>不得包含前导或尾随字符。例如,名为subprojectMUST 的文件夹必须传递为subproject,而不是./subproject/

Windows 用户注意事项:当您的文件夹深度大于 1 时,<name-of-folder>必须使用 *nix 样式的文件夹分隔符 (/)。例如,名为的文件夹path1\path2\subproject必须作为path1/path2/subproject

  1. 创建新的仓库

     mkdir ~/<new-repo> && cd ~/<new-repo>
     git init
     git pull </path/to/big-repo> <name-of-new-branch>
    
  2. 将新的 repo 链接到 GitHub 或任何地方

     git remote add origin <git@github.com:user/new-repo.git>
     git push -u origin master
    
  3. 如果需要<big-repo>,清理内部

     git rm -rf <name-of-folder>
    

注意:这会在存储库中留下所有历史参考。如果您确实担心已提交密码或需要减小文件夹的文件大小,请参阅下面的附录.git


演练

这些步骤与上面相同,但遵循我的存储库的确切步骤,而不是使用<meta-named-things>.

这是我在节点中实现 JavaScript 浏览器模块的项目:

tree ~/node-browser-compat

node-browser-compat
├── ArrayBuffer
├── Audio
├── Blob
├── FormData
├── atob
├── btoa
├── location
└── navigator

我想将单个文件夹 ,btoa拆分为单独的 Git 存储库

cd ~/node-browser-compat/
git subtree split -P btoa -b btoa-only

我现在有一个新的分支,btoa-only只有提交btoa,我想创建一个新的存储库。

mkdir ~/btoa/ && cd ~/btoa/
git init
git pull ~/node-browser-compat btoa-only

接下来,我在 GitHub 或 Bitbucket 或其他任何地方创建一个新的存储库并将其添加为origin

git remote add origin git@github.com:node-browser-compat/btoa.git
git push -u origin master

愉快的一天!

注意:如果您创建了一个带有README.md,.gitignore和的仓库LICENSE,您需要先拉取:

git pull origin master
git push origin master

最后,我想从更大的仓库中删除该文件夹

git rm -rf btoa

附录

macOS 上的最新 Git

使用Homebrew获取最新版本的 Git :

brew install git

Ubuntu 上的最新 Git

sudo apt-get update
sudo apt-get install git
git --version

如果这不起作用(您的 Ubuntu 版本非常旧),请尝试

sudo add-apt-repository ppa:git-core/ppa
sudo apt-get update
sudo apt-get install git

如果这仍然不起作用,请尝试

sudo chmod +x /usr/share/doc/git/contrib/subtree/git-subtree.sh
sudo ln -s \
/usr/share/doc/git/contrib/subtree/git-subtree.sh \
/usr/lib/git-core/git-subtree

感谢评论中的rui.araujo

清除您的历史记录

默认情况下,从 Git 中删除文件实际上并没有删除它们,它只是提交它们不再存在。如果您想实际删除历史引用(即您提交了密码),您需要这样做:

git filter-branch --prune-empty --tree-filter 'rm -rf <name-of-folder>' HEAD

之后,您可以检查您的文件或文件夹是否不再显示在 Git 历史记录中

git log -- <name-of-folder> # should show nothing

但是,您不能将删除“推送”到 GitHub等。如果你尝试,你会得到一个错误,你必须git pull在你能做到之前git push- 然后你又回到你的历史中。

因此,如果您想从“来源”中删除历史记录(即从 GitHub、Bitbucket 等中删除),您需要删除存储库并重新推送经过修剪的存储库副本。但是等等 -还有更多!- 如果您真的担心删除密码或类似的东西,您需要修剪备份(见下文)。

.git

前面提到的删除历史命令仍然会留下一堆备份文件——因为 Git 非常好心地帮助您避免意外破坏您的存储库。它最终会在几天和几个月内删除孤立的文件,但它会将它们保留一段时间,以防您意识到您不小心删除了您不想删除的内容。

因此,如果您真的想立即清空垃圾箱减少 repo 的克隆大小,您必须执行所有这些非常奇怪的事情:

rm -rf .git/refs/original/ && \
git reflog expire --all && \
git gc --aggressive --prune=now

git reflog expire --all --expire-unreachable=0
git repack -A -d
git prune

也就是说,除非你知道你需要这样做,否则我建议不要执行这些步骤——以防万一你修剪了错误的子目录,你知道吗?推送存储库时不应克隆备份文件,它们只会在您的本地副本中。

信用

于 2013-07-25T17:10:06.293 回答
1264

更新:这个过程非常普遍,以至于 git 团队使用新工具使其变得更加简单,git subtree. 请参阅此处:将子目录分离(移动)到单独的 Git 存储库中


您想要克隆您的存储库,然后使用git filter-branch标记除您希望在新存储库中被垃圾收集的子目录之外的所有内容。

  1. 要克隆本地存储库:

    git clone /XYZ /ABC
    

    (注意:存储库将使用硬链接克隆,但这不是问题,因为硬链接文件本身不会被修改 - 将创建新文件。)

  2. 现在,让我们保留我们想要重写的有趣分支,然后删除源以避免推送到那里,并确保源不会引用旧提交:

    cd /ABC
    for i in branch1 br2 br3; do git branch -t $i origin/$i; done
    git remote rm origin
    

    或所有远程分支:

    cd /ABC
    for i in $(git branch -r | sed "s/.*origin\///"); do git branch -t $i origin/$i; done
    git remote rm origin
    
  3. 现在您可能还想删除与子项目无关的标签;你也可以稍后再做,但你可能需要再次修剪你的回购。我没有这样做并且得到了WARNING: Ref 'refs/tags/v0.1' is unchanged所有标签(因为它们都与子项目无关);此外,删除此类标签后,将回收更多空间。显然git filter-branch应该能够重写其他标签,但我无法验证这一点。如果要删除所有标签,请使用git tag -l | xargs git tag -d.

  4. 然后使用 filter-branch 和 reset 排除其他文件,以便修剪它们。让我们还添加--tag-name-filter cat --prune-empty以删除空提交并重写标签(请注意,这将不得不剥离它们的签名):

    git filter-branch --tag-name-filter cat --prune-empty --subdirectory-filter ABC -- --all
    

    或者,仅重写 HEAD 分支并忽略标签和其他分支:

    git filter-branch --tag-name-filter cat --prune-empty --subdirectory-filter ABC HEAD
    
  5. 然后删除备份的 reflogs 以便真正回收空间(尽管现在该操作是破坏性的)

    git reset --hard
    git for-each-ref --format="%(refname)" refs/original/ | xargs -n 1 git update-ref -d
    git reflog expire --expire=now --all
    git gc --aggressive --prune=now
    

    现在你有一个 ABC 子目录的本地 git 存储库,它的所有历史都保留了。

注意:对于大多数用途,git filter-branch确实应该有添加的参数-- --all。是的,确实如此--space-- all。这需要是命令的最后一个参数。正如 Matli 发现的那样,这会使项目分支和标签包含在新的 repo 中。

编辑:合并了来自以下评论的各种建议,以确保例如存储库实际上已缩小(以前并非总是如此)。

于 2008-12-11T15:40:54.280 回答
139

Paul 的回答创建了一个包含 /ABC 的新存储库,但没有从 /XYZ 中删除 /ABC。以下命令将从 /XYZ 中删除 /ABC:

git filter-branch --tree-filter "rm -rf ABC" --prune-empty HEAD

当然,首先在 'clone --no-hardlinks' 存储库中对其进行测试,然后使用 Paul 列出的 reset、gc 和 prune 命令进行跟踪。

于 2009-06-05T13:15:20.737 回答
98

我发现为了从新存储库中正确删除旧历史记录,您必须在该filter-branch步骤之后做更多的工作。

  1. 进行克隆和过滤:

    git clone --no-hardlinks foo bar; cd bar
    git filter-branch --subdirectory-filter subdir/you/want
    
  2. 删除所有对旧历史的引用。“origin” 跟踪你的克隆,“original” 是 filter-branch 保存旧东西的地方:

    git remote rm origin
    git update-ref -d refs/original/refs/heads/master
    git reflog expire --expire=now --all
    
  3. 即使是现在,您的历史记录也可能被困在 fsck 不会触及的包文件中。将其撕成碎片,创建一个新的包文件并删除未使用的对象:

    git repack -ad
    

在 filter-branch的手册中有对此的解释

于 2009-10-19T21:10:21.860 回答
40

编辑:添加了 Bash 脚本。

这里给出的答案对我来说只是部分工作;许多大文件留在缓存中。最终奏效的方法(在 freenode 上的 #git 下班后):

git clone --no-hardlinks file:///SOURCE /tmp/blubb
cd blubb
git filter-branch --subdirectory-filter ./PATH_TO_EXTRACT  --prune-empty --tag-name-filter cat -- --all
git clone file:///tmp/blubb/ /tmp/blooh
cd /tmp/blooh
git reflog expire --expire=now --all
git repack -ad
git gc --prune=now

使用以前的解决方案,存储库大小约为 100 MB。这个使它下降到 1.7 MB。也许它可以帮助某人:)


以下 bash 脚本自动执行该任务:

!/bin/bash

if (( $# < 3 ))
then
    echo "Usage:   $0 </path/to/repo/> <directory/to/extract/> <newName>"
    echo
    echo "Example: $0 /Projects/42.git first/answer/ firstAnswer"
    exit 1
fi


clone=/tmp/${3}Clone
newN=/tmp/${3}

git clone --no-hardlinks file://$1 ${clone}
cd ${clone}

git filter-branch --subdirectory-filter $2  --prune-empty --tag-name-filter cat -- --all

git clone file://${clone} ${newN}
cd ${newN}

git reflog expire --expire=now --all
git repack -ad
git gc --prune=now
于 2011-06-09T15:41:37.473 回答
28

git filter-branch使用更新版本的git2.22+也许?)运行时,它说要使用这个新工具git-filter-repo。这个工具无疑为我简化了事情。

使用 filter-repo 过滤

XYZ从原始问题创建 repo 的命令:

# create local clone of original repo in directory XYZ
tmp $ git clone git@github.com:user/original.git XYZ

# switch to working in XYZ
tmp $ cd XYZ

# keep subdirectories XY1 and XY2 (dropping ABC)
XYZ $ git filter-repo --path XY1 --path XY2

# note: original remote origin was dropped
# (protecting against accidental pushes overwriting original repo data)

# XYZ $ ls -1
# XY1
# XY2

# XYZ $ git log --oneline
# last commit modifying ./XY1 or ./XY2
# first commit modifying ./XY1 or ./XY2

# point at new hosted, dedicated repo
XYZ $ git remote add origin git@github.com:user/XYZ.git

# push (and track) remote master
XYZ $ git push -u origin master

假设: * 远程 XYZ 仓库在推送之前是新的并且是空的

过滤和移动

就我而言,我还想移动几个目录以获得更一致的结构。最初,我运行那个简单filter-repo的命令,然后运行 ​​,但我发现使用该选项git mv dir-to-rename可以获得稍微“更好”的历史记录。我现在看到(在 GitHub UI 中),而--path-rename不是在新存储库中看到移动文件的最后修改时间,它与原始存储库中的修改时间相匹配。5 hours agolast year

代替...

git filter-repo --path XY1 --path XY2 --path inconsistent
git mv inconsistent XY3  # which updates last modification time

最后我跑了...

git filter-repo --path XY1 --path XY2 --path inconsistent --path-rename inconsistent:XY3
笔记:
  • 我认为Git Rev News 博客文章很好地解释了创建另一个回购过滤工具的原因。
  • 我最初尝试了在原始存储库中创建与目标存储库名称匹配的子目录然后过滤(使用git filter-repo --subdirectory-filter dir-matching-new-repo-name)的路径。该命令正确地将该子目录转换为复制的本地 repo 的根目录,但它也导致仅创建子目录的三个提交的历史记录。(我没有意识到--path可以多次指定;因此,无需在源代码库中创建子目录。)因为当我注意到我未能继续执行时,有人已经提交了源代码库历史,我只是git reset commit-before-subdir-move --hardclone命令之后使用,并添加--forcefilter-repo命令中以使其对稍微修改的本地克隆进行操作。
git clone ...
git reset HEAD~7 --hard      # roll back before mistake
git filter-repo ... --force  # tell filter-repo the alterations are expected
  • 因为我不知道扩展模式,所以我很难安装git,但最终我克隆了git-filter-repo并将其符号链接到$(git --exec-path)
ln -s ~/github/newren/git-filter-repo/git-filter-repo $(git --exec-path)
于 2019-11-21T21:22:41.743 回答
27

这不再那么复杂,您只需在您的 repo 的克隆上使用git filter-branch命令来剔除您不想要的子目录,然后推送到新的远程。

git filter-branch --prune-empty --subdirectory-filter <YOUR_SUBDIR_TO_KEEP> master
git push <MY_NEW_REMOTE_URL> -f .
于 2014-08-20T14:11:53.687 回答
19

更新: git-subtree 模块非常有用,以至于 git 团队将其拉入核心并制作了它git subtree。请参阅此处:将子目录分离(移动)到单独的 Git 存储库中

git-subtree 可能对此有用

http://github.com/apenwarr/git-subtree/blob/master/git-subtree.txt(已弃用)

http://psionides.jogger.pl/2010/02/04/sharing-code-between-projects-with-git-subtree/

于 2010-03-22T20:55:26.383 回答
19

这是对CoolAJ86“The Easy Way™”答案的一个小修改,以便将多个子文件夹(比如说sub1sub2)拆分到一个新的 git 存储库中。

The Easy Way™(多个子文件夹)

  1. 准备旧仓库

    pushd <big-repo>
    git filter-branch --tree-filter "mkdir <name-of-folder>; mv <sub1> <sub2> <name-of-folder>/" HEAD
    git subtree split -P <name-of-folder> -b <name-of-new-branch>
    popd
    

    注意: <name-of-folder>不得包含前导或尾随字符。例如,名为subprojectMUST 的文件夹必须传递为subproject,而不是./subproject/

    Windows 用户注意:当您的文件夹深度大于 1 时,<name-of-folder>必须使用 *nix 样式的文件夹分隔符 (/)。例如,名为的文件夹path1\path2\subproject必须作为path1/path2/subproject. 此外,不要使用mv命令但是move.

    最后说明:与基本答案的独特而巨大的区别是脚本的第二行“ git filter-branch...

  2. 创建新的仓库

    mkdir <new-repo>
    pushd <new-repo>
    
    git init
    git pull </path/to/big-repo> <name-of-new-branch>
    
  3. 将新的 repo 链接到 Github 或其他任何地方

    git remote add origin <git@github.com:my-user/new-repo.git>
    git push origin -u master
    
  4. 清理,如果需要

    popd # get out of <new-repo>
    pushd <big-repo>
    
    git rm -rf <name-of-folder>
    

    注意:这会保留存储库中的所有历史参考。如果您真的担心提交密码或需要减小文件夹的文件大小,请参阅原始答案中的附录.git

于 2015-08-06T15:26:51.363 回答
13

原始问题希望 XYZ/ABC/(*files) 变为 ABC/ABC/(*files)。在为我自己的代码实现可接受的答案后,我注意到它实际上将 XYZ/ABC/(*files) 更改为 ABC/(*files)。filter-branch 手册页甚至说,

结果将包含该目录(并且仅包含该目录)作为其项目根目录。”

换句话说,它将顶级文件夹“向上”提升一级。这是一个重要的区别,因为例如,在我的历史中,我重命名了一个顶级文件夹。通过将文件夹“向上”提升一级,git 在我进行重命名的提交时失去了连续性。

过滤器分支后我失去了连续性

我对这个问题的回答是制作 2 个存储库副本并手动删除要保留在每个中的文件夹。手册页支持我:

[...] 如果一个简单的单次提交足以解决您的问题,请避免使用 [此命令]

于 2012-04-17T05:12:06.860 回答
7

为了补充Paul 的答案,我发现要最终恢复空间,我必须将 HEAD 推送到一个干净的存储库,并减少 .git/objects/pack 目录的大小。

IE

$ mkdir ...ABC.git
$ cd ...ABC.git
$ git init --bare

在 gc prune 之后,还要执行以下操作:

$ git push ...ABC.git HEAD

然后你可以做

$ git clone ...ABC.git

并且 ABC/.git 的大小减小了

实际上,推送清理存储库不需要一些耗时的步骤(例如 git gc),即:

$ git clone --no-hardlinks /XYZ /ABC
$ git filter-branch --subdirectory-filter ABC HEAD
$ git reset --hard
$ git push ...ABC.git HEAD
于 2009-07-25T10:01:26.310 回答
7

现在正确的方法如下:

git filter-branch --prune-empty --subdirectory-filter FOLDER_NAME [first_branch] [another_branch]

GitHub 现在甚至有关于此类案例的小文章。

但请务必先将原始存储库克隆到单独的目录(因为它会删除所有文件和其他目录,您可能需要使用它们)。

所以你的算法应该是:

  1. 将您的远程仓库克隆到另一个目录
  2. 仅使用git filter-branch某些子目录下的文件,推送到新的远程
  3. 创建提交以从原始远程存储库中删除此子目录
于 2014-11-12T13:22:04.530 回答
6

似乎这里的大多数(全部?)答案都依赖于某种形式git filter-branch --subdirectory-filter及其同类。这可能在“大多数时候”有效,但是在某些情况下,例如当您重命名文件夹时,例如:

 ABC/
    /move_this_dir # did some work here, then renamed it to

ABC/
    /move_this_dir_renamed

如果您使用普通的 git 过滤器样式来提取“move_this_dir_renamed”,您将丢失最初为“move_this_dir”(ref)时发生的文件更改历史记录。

因此,似乎真正保留所有更改历史记录的唯一方法(如果你的情况是这样的话)本质上是复制存储库(创建一个新的存储库,将其设置为原点),然后核对其他所有内容并将子目录重命名为父目录,如下所示:

  1. 在本地克隆多模块项目
  2. 分支 - 检查那里有什么:git branch -a
  3. 对要包含在拆分中的每个分支进行检查,以在您的工作站上获取本地副本:git checkout --track origin/branchABC
  4. 在新目录中制作副本:cp -r oldmultimod simple
  5. 进入新的项目副本:cd simple
  6. 去掉这个项目中不需要的其他模块:
  7. git rm otherModule1 other2 other3
  8. 现在只剩下目标模块的子目录
  9. 去掉模块子目录,使模块根成为新的项目根
  10. git mv moduleSubdir1/* .
  11. 删除 relic 子目录:rmdir moduleSubdir1
  12. 随时检查更改:git status
  13. 创建新的 git 存储库并复制其 URL 以将此项目指向其中:
  14. git remote set-url origin http://mygithost:8080/git/our-splitted-module-repo
  15. 验证这是好的:git remote -v
  16. 将更改推送到远程仓库:git push
  17. 转到远程仓库并检查它是否都在那里
  18. 对需要的任何其他分支重复此操作:git checkout branch2

这遵循github 文档“将子文件夹拆分到新存储库”步骤 6-11 将模块推送到新存储库。

这不会在您的 .git 文件夹中为您节省任何空间,但它会保留您对这些文件的所有更改历史记录,即使在重命名时也是如此。如果没有“很多”历史丢失等,这可能不值得。但至少可以保证您不会丢失较旧的提交!

于 2016-09-19T18:46:40.660 回答
6

我推荐GitHub 的将子文件夹拆分为新存储库的指南。这些步骤类似于保罗的回答,但我发现他们的说明更容易理解。

我已经修改了说明,以便它们申请本地存储库,而不是托管在 GitHub 上的存储库。


将子文件夹拆分到新存储库中

  1. 打开 Git Bash。

  2. 将当前工作目录更改为您要创建新存储库的位置。

  3. 克隆包含子文件夹的存储库。

git clone OLD-REPOSITORY-FOLDER NEW-REPOSITORY-FOLDER
  1. 将当前工作目录更改为克隆的存储库。

cd REPOSITORY-NAME
  1. 要从存储库中的其余文件中过滤掉子文件夹,请运行git filter-branch,并提供以下信息:
    • FOLDER-NAME:项目中您要从中创建单独存储库的文件夹。
      • 提示:Windows 用户应该使用/来分隔文件夹。
    • BRANCH-NAME:当前项目的默认分支,例如,mastergh-pages.

git filter-branch --prune-empty --subdirectory-filter FOLDER-NAME  BRANCH-NAME 
# Filter the specified branch in your directory and remove empty commits
Rewrite 48dc599c80e20527ed902928085e7861e6b3cbe6 (89/89)
Ref 'refs/heads/BRANCH-NAME' was rewritten
于 2017-08-31T14:02:49.557 回答
5

我确实遇到了这个问题,但是所有基于 git filter-branch 的标准解决方案都非常慢。如果您有一个小型存储库,那么这可能不是问题,它适合我。我编写了另一个基于 libgit2 的 git 过滤程序,它首先为主存储库的每个过滤创建分支,然后将它们推送到清理存储库作为下一步。在我的存储库(500Mb 100000 次提交)上,标准的 git filter-branch 方法需要几天时间。我的程序需要几分钟来做同样的过滤。

它有一个神话般的名字 git_filter 并住在这里:

https://github.com/slobobaby/git_filter

在 GitHub 上。

我希望它对某人有用。

于 2014-03-10T17:39:13.373 回答
4

使用此过滤器命令删除子目录,同时保留您的标签和分支:

git filter-branch --index-filter \
"git rm -r -f --cached --ignore-unmatch DIR" --prune-empty \
--tag-name-filter cat -- --all
于 2010-10-28T02:36:37.497 回答
4

对于它的价值,这里是在 Windows 机器上使用 GitHub 的方法。假设您有一个克隆的 repo 驻留在C:\dir1. 目录结构如下所示:C:\dir1\dir2\dir3. 该dir3目录是我想成为一个新的独立仓库的目录。

GitHub:

  1. 创建新的存储库:MyTeam/mynewrepo

重击提示:

  1. $ cd c:/Dir1
  2. $ git filter-branch --prune-empty --subdirectory-filter dir2/dir3 HEAD
    返回:(Ref 'refs/heads/master' was rewritten仅供参考:dir2/dir3 区分大小写。)

  3. $ git remote add some_name git@github.com:MyTeam/mynewrepo.git
    git remote add origin etc. 没用,退了“ remote origin already exists

  4. $ git push --progress some_name master

于 2012-02-07T19:07:35.393 回答
3

正如我上面提到的,我不得不使用反向解决方案(删除所有未触及我的提交dir/subdir/targetdir),这似乎可以很好地删除大约 95% 的提交(根据需要)。然而,还有两个小问题。

首先,filter-branch在删除引入或修改代码的提交方面做得很出色,但显然,合并提交位于Gitiverse中的位置之下。

这是一个我可能可以忍受的化妆品问题(他说......慢慢后退,避开眼睛)

第二,剩下的少数提交几乎都是重复的!我似乎获得了第二条冗余的时间线,它几乎涵盖了该项目的整个历史。有趣的是(您可以从下图中看到),我的三个本地分支并不都在同一时间线上(这当然是它存在的原因,而不仅仅是垃圾收集)。

我唯一能想象的是,其中一个已删除的提交可能是filter-branch 实际执行 delete的单个合并提交,并且创建了并行时间线,因为每个现在未合并的链都获取了自己的提交副本。(耸耸肩,我的 TARDiS 在哪里?)我很确定我可以解决这个问题,尽管我真的很想了解它是如何发生的。

在疯狂的 mergefest-O-RAMA 的情况下,我可能会不理会它,因为它已在我的提交历史中如此牢固地根深蒂固——每当我靠近时都会威胁我——它似乎并没有真正导致任何非美容问题,因为它在 Tower.app 中非常漂亮。

于 2013-05-31T10:01:26.073 回答
3

更简单的方法

  1. 安装git splits. 我根据jkeating 的解决方案将它创建为 git 扩展。
  2. 将目录拆分为本地分支 #change into your repo's directory cd /path/to/repo #checkout the branch git checkout XYZ
    #split multiple directories into new branch XYZ git splits -b XYZ XY1 XY2

  3. 在某处创建一个空仓库。我们假设我们已经xyz在 GitHub 上创建了一个空仓库,其路径为:git@github.com:simpliwp/xyz.git

  4. 推送到新的仓库。 #add a new remote origin for the empty repo so we can push to the empty repo on GitHub git remote add origin_xyz git@github.com:simpliwp/xyz.git #push the branch to the empty repo's master branch git push origin_xyz XYZ:master

  5. 将新创建的远程仓库克隆到新的本地目录中
    #change current directory out of the old repo cd /path/to/where/you/want/the/new/local/repo #clone the remote repo you just pushed to git clone git@github.com:simpliwp/xyz.git

于 2015-02-11T10:28:34.997 回答
2

在垃圾收集之前,您可能需要“git reflog expire --expire=now --all”之类的东西来实际清除文件。git filter-branch 仅删除历史记录中的引用,但不会删除包含数据的 reflog 条目。当然,先测试一下。

这样做时我的磁盘使用量急剧下降,尽管我的初始条件有些不同。也许 --subdirectory-filter 否定了这种需求,但我对此表示怀疑。

于 2009-06-12T02:49:26.910 回答
2

在https://github.com/vangorra/git_split查看 git_split 项目

在自己的位置将 git 目录变成自己的存储库。没有子树有趣的事情。该脚本将获取您的 git 存储库中的现有目录,并将该目录转换为它自己的独立存储库。在此过程中,它将复制您提供的目录的整个更改历史记录。

./git_split.sh <src_repo> <src_branch> <relative_dir_path> <dest_repo>
        src_repo  - The source repo to pull from.
        src_branch - The branch of the source repo to pull from. (usually master)
        relative_dir_path   - Relative path of the directory in the source repo to split.
        dest_repo - The repo to push to.
于 2016-01-06T02:42:05.683 回答
1

把它放到你的 gitconfig 中:

reduce-to-subfolder = !sh -c 'git filter-branch --tag-name-filter cat --prune-empty --subdirectory-filter cookbooks/unicorn HEAD && git reset --hard && git for-each-ref refs/original/ | cut -f 2 | xargs -n 1 git update-ref -d && git reflog expire --expire=now --all && git gc --aggressive --prune=now && git remote rm origin'
于 2013-03-29T20:18:09.520 回答
1

我确信 git subtree 一切都很好,但是我想要移动的 git 托管代码的子目录都在 eclipse 中。因此,如果您使用的是 egit,这非常容易。获取您要移动的项目并组队->断开连接,然后组队->将其共享到新位置。它将默认尝试使用旧的 repo 位置,但您可以取消选中 use-existing 选择并选择新的位置来移动它。万岁万岁。

于 2016-02-10T16:57:12.867 回答
0

您可以轻松尝试https://help.github.com/enterprise/2.15/user/articles/splitting-a-subfolder-out-into-a-new-repository/

这对我有用。我在上面给出的步骤中遇到的问题是

  1. 在这个命令git filter-branch --prune-empty --subdirectory-filter FOLDER-NAME BRANCH-NAMEBRANCH-NAME

  2. 如果由于保护问题而在提交时最后一步失败,请遵循 - https://docs.gitlab.com/ee/user/project/protected_branches.html

于 2019-01-10T07:23:15.530 回答
0

我找到了非常直接的解决方案,想法是复制存储库,然后删除不必要的部分。这是它的工作原理:

1) 克隆一个你想要拆分的仓库

git clone git@git.thehost.io:testrepo/test.git

2)移动到git文件夹

cd test/

2)删除不必要的文件夹并提交

rm -r ABC/
git add .
enter code here
git commit -m 'Remove ABC'

3) 使用BFG删除不必要的文件夹表单历史记录

cd ..
java -jar bfg.jar --delete-folders "{ABC}" test
cd test/
git reflog expire --expire=now --all && git gc --prune=now --aggressive

对于多个文件夹,您可以使用逗号

java -jar bfg.jar --delete-folders "{ABC1,ABC2}" metric.git

4)检查历史记录不包含您刚刚删除的文件/文件夹

git log --diff-filter=D --summary | grep delete

5) 现在你有了没有 ABC 的干净存储库,所以只需将其推送到新的来源

remote add origin git@github.com:username/new_repo
git push -u origin master

就是这样。您可以重复这些步骤以获取另一个存储库,

只需删除 XY1,XY2 并在第 3 步重命名 XYZ -> ABC

于 2019-03-28T14:07:25.410 回答
0

发现这篇精彩的文章原始参考很容易理解。如果无法访问,请在此处记录。

1. 准备当前仓库

$ cd path/to/repository
$ git subtree split -P my-folder -b my-folder
Created branch 'my-folder'
aecbdc3c8fe2932529658f5ed40d95c135352eff

文件夹的名称必须是相对路径,从存储库的根目录开始。

2. 创建新的存储库

$ cd my-folder
$ git init
Initialized empty Git repository in /Users/adamwest/Projects/learngit/shop/my-folder/.git/
$ git add .
$ git commit -m "initial commit"
[master (root-commit) 192c10b] initial commit
 1 file changed, 0 insertions(+), 0 deletions(-)
 create mode 100644 file

在这里,我们只需要 cd 到新文件夹,初始化新存储库,并提交任何内容。

3.新增远程仓库并推送

$ git remote add origin git@github.com:robertlyall/my-folder.git
$ git push origin -u master
Enumerating objects: 3, done.
Counting objects: 100% (3/3), done.
Writing objects: 100% (3/3), 199 bytes | 199.00 KiB/s, done.
Total 3 (delta 0), reused 0 (delta 0)
To github.com:robertlyall/my-folder.git
 * [new branch]      master -> master
Branch 'master' set up to track remote branch 'master' from 'origin'.

我们从 GitHub 远程添加新的存储库,然后将我们的第一个提交推送到它。

4.从主存储库中删除文件夹并推送

$ cd ../
$ git rm -rf my-folder
rm 'my-folder/file'
$ git commit -m "Remove old folder"
[master 56aedbe] remove old folder
 1 file changed, 0 insertions(+), 0 deletions(-)
 delete mode 100644 my-folder/file
$ git push
Enumerating objects: 3, done.
Counting objects: 100% (3/3), done.
Delta compression using up to 4 threads
Compressing objects: 100% (2/2), done.
Writing objects: 100% (2/2), 217 bytes | 217.00 KiB/s, done.
Total 2 (delta 1), reused 0 (delta 0)
remote: Resolving deltas: 100% (1/1), completed with 1 local object.
To github.com:robertlyall/shop.git
   74dd8b3..56aedbe  master -> master

最后,我们 cd 回到根目录,从我们的主存储库中删除该文件夹,然后提交并推送更改。现在,我们的主存储库中有该文件夹,但链接到一个完全独立的存储库,可以跨多个项目重用。

于 2021-07-10T12:13:06.293 回答