如何从 git repo 中只签出一个文件?
21 回答
最初,我在 2012 年提到git archive
(参见Jared Forsyth的回答和Robert Knight的回答),自git1.7.9.5 (March 2012)以来,Paul Brannan的回答:
git archive --format=tar --remote=origin HEAD:path/to/directory -- filename | tar -O -xf -
但是:在 2013 年,远程 https://github.com URL不再可行。
请参阅旧页面“我可以归档存储库吗? ”
当前(2018 年)页面“关于在 GitHub 上归档内容和数据”建议使用第三方服务,如GHTorrent或GH Archive。
所以你也可以处理本地副本/克隆:
如果您有此答案中提到的裸存储库的本地副本,您也可以执行以下操作,
git --no-pager --git-dir /path/to/bar/repo.git show branch:path/to/file >file
或者您必须首先克隆存储库,这意味着您可以获得完整的历史记录: - 在 .git 存储库中 - 在工作树中。
- 但是您可以进行稀疏结帐(如果您使用的是 Git1.7+):
- 启用稀疏结帐选项 (
git config core.sparsecheckout true
) - 在文件中添加您想看到的
.git/info/sparse-checkout
内容 - 重新阅读工作树以仅显示您需要的内容
- 启用稀疏结帐选项 (
要重新读取工作树:
$ git read-tree -m -u HEAD
这样,您最终会得到一个工作树,其中包含您想要的内容(即使它只有一个文件)
Richard Gomes指出(在评论中)“如何从 git 存储库克隆、获取或稀疏检出单个目录或目录列表? ”
避免下载历史记录的 bash 函数,它检索单个分支并检索您需要的文件或目录列表。
首先使用 -n 选项克隆 repo,该选项禁止所有文件的默认签出,以及 --depth 1 选项,这意味着它只获取每个文件的最新版本
git clone -n git://path/to/the_repo.git --depth 1
然后只检查你想要的文件,如下所示:
cd the_repo
git checkout HEAD name_of_file
如果您已经拥有 git repo 的副本,您可以随时使用 agit log
来签出文件的版本以找出哈希 ID(例如 3cdc61015724f9965575ba954c8cd4232c8b42e4),然后您只需键入:
git checkout hash-id path-to-file
这是一个实际的例子:
git checkout 3cdc61015724f9965575ba954c8cd4232c8b42e4 /var/www/css/page.css
git
通常,如果不按照第一个答案中的建议下载整个存储库,就不可能只下载一个文件。这是因为 Git 不会像你想象的那样存储文件(就像 CVS/SVN 那样),而是根据项目的整个历史生成它们。
但是有一些针对特定情况的解决方法。下面的示例带有user
, project
, branch
,的占位符filename
。
GitHub
wget https://raw.githubusercontent.com/user/project/branch/filename
GitLab
wget https://gitlab.com/user/project/raw/branch/filename
GitWeb
如果您在服务器上使用 Git - GitWeb,那么您可以尝试示例(将其更改为正确的路径):
wget "http://example.com/gitweb/?p=example;a=blob_plain;f=README.txt;hb=HEAD"
drupalcode.org 上的 GitWeb
例子:
wget "http://drupalcode.org/project/ads.git/blob_plain/refs/heads/master:/README.md"
googlesource.com
有一个未记录的功能允许您下载原始文件的 base64 编码版本:
curl "https://chromium.googlesource.com/chromium/src/net/+/master/http/transport_security_state_static.json?format=TEXT" | base64 --decode
在其他情况下,请检查您的 Git 存储库是否正在使用任何 Web 界面。
如果它没有使用任何 Web 界面,您可以考虑将您的代码推送到外部服务,例如GitHub、Bitbucket等。并将其用作镜子。
如果您还没有wget
安装,请尝试curl -O (url)
替代。
git checkout branch_or_version -- 路径/文件
例子:git checkout HEAD -- main.c
现在我们可以了!由于这是谷歌上的第一个结果,我想我会把它更新到最新的状态。随着 git 1.7.9.5 的出现,我们有了git archive
可以让您从远程主机检索单个文件的命令。
git archive --remote=git://git.foo.com/project.git HEAD:path/in/repo filename | tar -x
在 GIT 1.7.2.2 中工作
例如,您有一个远程some_remote分支branch1,branch32
所以要签出一个特定的文件,你可以调用这个命令:
git checkout remote/branch path/to/file
例如,它将是这样的
git checkout some_remote/branch32 conf/en/myscript.conf
git checkout some_remote/branch1 conf/fr/load.wav
这个 checkout 命令会将整个文件结构 conf/en 和 conf/fr 复制到你调用这些命令的当前目录中(当然我假设你之前运行过 git init )
这是在 git 存储库中仅拉取和推送特定文件的完整解决方案:
- 首先,您需要使用特殊提示克隆 git 存储库 - 不签出
git clone --no-checkout <git url>
- 下一步是使用以下命令删除索引中的未暂存文件:
git reset
- 现在您可以使用以下命令开始提取要更改的文件:
git checkout origin/master <path to file>
- 现在存储库文件夹包含您可以立即开始编辑的文件。编辑后,您需要执行简单而熟悉的命令序列。
git add <path to file>
git commit -m <message text>
git push
很简单:
git checkout from-branch-name -- path/to/the/file/you/want
这不会检出from-branch-name
分支。您将留在您所在的任何分支上,并且只会从指定的分支中签出该单个文件。
这是手册页的相关部分git-checkout
git checkout [-p|--patch] [<tree-ish>] [--] <pathspec>...
When <paths> or --patch are given, git checkout does not switch
branches. It updates the named paths in the working tree from the
index file or from a named <tree-ish> (most often a commit). In
this case, the -b and --track options are meaningless and giving
either of them results in an error. The <tree-ish> argument can be
used to specify a specific tree-ish (i.e. commit, tag or tree) to
update the index for the given paths before updating the working
tree.
向 Ariejan de Vroom 致敬,他从这篇博文中教会了我这一点。
git clone --filter
从 Git 2.19
此选项实际上会跳过从服务器获取大多数不需要的对象:
git clone --depth 1 --no-checkout --filter=blob:none \
"file://$(pwd)/server_repo" local_repo
cd local_repo
git checkout master -- mydir/myfile
服务器应配置:
git config --local uploadpack.allowfilter 1
git config --local uploadpack.allowanysha1inwant 1
从 v2.19.0 开始没有服务器支持,但已经可以在本地进行测试。
TODO:--filter=blob:none
跳过所有 blob,但仍获取所有树对象。但是在正常的仓库中,与文件本身相比,这应该很小,所以这已经足够好了。问:https: //www.spinics.net/lists/git/msg342006.html 开发人员回答说--filter=tree:0
正在努力做到这一点。
请记住,这--depth 1
已经暗示了--single-branch
,另请参阅:如何在 Git 中克隆单个分支?
file://$(path)
需要克服git clone
协议恶作剧:如何用相对路径浅克隆本地 git 存储库?
的格式--filter
记录在man git-rev-list
.
对 Git 远程协议进行了扩展以支持此功能。
Git 树上的文档:
- https://github.com/git/git/blob/v2.19.0/Documentation/technical/partial-clone.txt
- https://github.com/git/git/blob/v2.19.0/Documentation/rev-list-options.txt#L720
- https://github.com/git/git/blob/v2.19.0/t/t5616-partial-clone.sh
测试一下
#!/usr/bin/env bash
set -eu
list-objects() (
git rev-list --all --objects
echo "master commit SHA: $(git log -1 --format="%H")"
echo "mybranch commit SHA: $(git log -1 --format="%H")"
git ls-tree master
git ls-tree mybranch | grep mybranch
git ls-tree master~ | grep root
)
# Reproducibility.
export GIT_COMMITTER_NAME='a'
export GIT_COMMITTER_EMAIL='a'
export GIT_AUTHOR_NAME='a'
export GIT_AUTHOR_EMAIL='a'
export GIT_COMMITTER_DATE='2000-01-01T00:00:00+0000'
export GIT_AUTHOR_DATE='2000-01-01T00:00:00+0000'
rm -rf server_repo local_repo
mkdir server_repo
cd server_repo
# Create repo.
git init --quiet
git config --local uploadpack.allowfilter 1
git config --local uploadpack.allowanysha1inwant 1
# First commit.
# Directories present in all branches.
mkdir d1 d2
printf 'd1/a' > ./d1/a
printf 'd1/b' > ./d1/b
printf 'd2/a' > ./d2/a
printf 'd2/b' > ./d2/b
# Present only in root.
mkdir 'root'
printf 'root' > ./root/root
git add .
git commit -m 'root' --quiet
# Second commit only on master.
git rm --quiet -r ./root
mkdir 'master'
printf 'master' > ./master/master
git add .
git commit -m 'master commit' --quiet
# Second commit only on mybranch.
git checkout -b mybranch --quiet master~
git rm --quiet -r ./root
mkdir 'mybranch'
printf 'mybranch' > ./mybranch/mybranch
git add .
git commit -m 'mybranch commit' --quiet
echo "# List and identify all objects"
list-objects
echo
# Restore master.
git checkout --quiet master
cd ..
# Clone. Don't checkout for now, only .git/ dir.
git clone --depth 1 --quiet --no-checkout --filter=blob:none "file://$(pwd)/server_repo" local_repo
cd local_repo
# List missing objects from master.
echo "# Missing objects after --no-checkout"
git rev-list --all --quiet --objects --missing=print
echo
echo "# Git checkout fails without internet"
mv ../server_repo ../server_repo.off
! git checkout master
echo
echo "# Git checkout fetches the missing file from internet"
mv ../server_repo.off ../server_repo
git checkout master -- d1/a
echo
echo "# Missing objects after checking out d1/a"
git rev-list --all --quiet --objects --missing=print
Git v2.19.0 中的输出:
# List and identify all objects
c6fcdfaf2b1462f809aecdad83a186eeec00f9c1
fc5e97944480982cfc180a6d6634699921ee63ec
7251a83be9a03161acde7b71a8fda9be19f47128
62d67bce3c672fe2b9065f372726a11e57bade7e
b64bf435a3e54c5208a1b70b7bcb0fc627463a75 d1
308150e8fddde043f3dbbb8573abb6af1df96e63 d1/a
f70a17f51b7b30fec48a32e4f19ac15e261fd1a4 d1/b
84de03c312dc741d0f2a66df7b2f168d823e122a d2
0975df9b39e23c15f63db194df7f45c76528bccb d2/a
41484c13520fcbb6e7243a26fdb1fc9405c08520 d2/b
7d5230379e4652f1b1da7ed1e78e0b8253e03ba3 master
8b25206ff90e9432f6f1a8600f87a7bd695a24af master/master
ef29f15c9a7c5417944cc09711b6a9ee51b01d89
19f7a4ca4a038aff89d803f017f76d2b66063043 mybranch
1b671b190e293aa091239b8b5e8c149411d00523 mybranch/mybranch
c3760bb1a0ece87cdbaf9a563c77a45e30a4e30e
a0234da53ec608b54813b4271fbf00ba5318b99f root
93ca1422a8da0a9effc465eccbcb17e23015542d root/root
master commit SHA: fc5e97944480982cfc180a6d6634699921ee63ec
mybranch commit SHA: fc5e97944480982cfc180a6d6634699921ee63ec
040000 tree b64bf435a3e54c5208a1b70b7bcb0fc627463a75 d1
040000 tree 84de03c312dc741d0f2a66df7b2f168d823e122a d2
040000 tree 7d5230379e4652f1b1da7ed1e78e0b8253e03ba3 master
040000 tree 19f7a4ca4a038aff89d803f017f76d2b66063043 mybranch
040000 tree a0234da53ec608b54813b4271fbf00ba5318b99f root
# Missing objects after --no-checkout
?f70a17f51b7b30fec48a32e4f19ac15e261fd1a4
?8b25206ff90e9432f6f1a8600f87a7bd695a24af
?41484c13520fcbb6e7243a26fdb1fc9405c08520
?0975df9b39e23c15f63db194df7f45c76528bccb
?308150e8fddde043f3dbbb8573abb6af1df96e63
# Git checkout fails without internet
fatal: '/home/ciro/bak/git/test-git-web-interface/other-test-repos/partial-clone.tmp/server_repo' does not appear to be a git repository
fatal: Could not read from remote repository.
Please make sure you have the correct access rights
and the repository exists.
# Git checkout fetches the missing directory from internet
remote: Enumerating objects: 1, done.
remote: Counting objects: 100% (1/1), done.
remote: Total 1 (delta 0), reused 0 (delta 0)
Receiving objects: 100% (1/1), 45 bytes | 45.00 KiB/s, done.
remote: Enumerating objects: 1, done.
remote: Counting objects: 100% (1/1), done.
remote: Total 1 (delta 0), reused 0 (delta 0)
Receiving objects: 100% (1/1), 45 bytes | 45.00 KiB/s, done.
# Missing objects after checking out d1
?f70a17f51b7b30fec48a32e4f19ac15e261fd1a4
?8b25206ff90e9432f6f1a8600f87a7bd695a24af
?41484c13520fcbb6e7243a26fdb1fc9405c08520
?0975df9b39e23c15f63db194df7f45c76528bccb
结论:除此之外的所有 blobd1/a
都丢失了。eg f70a17f51b7b30fec48a32e4f19ac15e261fd1a4
,也就是d1/b
结帐后不存在d1/
。
请注意root/root
和mybranch/mybranch
也丢失了,但从--depth 1
丢失的文件列表中隐藏了它。如果您删除--depth 1
,则它们会显示在丢失文件列表中。
已经给出的两个变体:
git archive --format=tar --remote=git://git.foo.com/project.git HEAD:path/to/directory filename | tar -O -xf -
和:
git archive --format=zip --remote=git://git.foo.com/project.git HEAD:path/to/directory filename | funzip
这些将文件写入标准输出。
你可以这样做
git archive --format=tar --remote=origin HEAD | tar xf -
git archive --format=tar --remote=origin HEAD <file> | tar xf -
假设文件名是 123.txt,这对我有用:
git checkout --theirs 123.txt
如果文件位于目录 A 中,请确保正确指定它:
git checkout --theirs "A/123.txt"
在 git 中,您不会在更新文件之前“签出”文件- 看起来这就是您所追求的。
许多系统,如 clearcase、csv 等,都要求您先“签出”文件,然后才能对其进行更改。Git 不需要这个。您克隆存储库,然后在存储库的本地副本中进行更改。
更新文件后,您可以执行以下操作:
git status
查看哪些文件已被修改。您首先添加要提交的内容index
(index
就像要签入的列表):
git add .
或者
git add blah.c
然后 dogit status
将向您显示哪些文件已被修改,哪些文件已index
准备好提交或签入。
要将文件提交到您的存储库副本,请执行以下操作:
git commit -a -m "commit message here"
有关手册和指南的链接,请参见git
网站。
如果您需要来自远程 Git 存储库的特定分支的特定文件,命令是:
git archive --remote=git://git.example.com/project.git refs/heads/mybranch path/to/myfile |tar xf -
其余的可以来自@VonC 的回答:
如果您需要来自 master 分支的特定文件,它是:
git archive --remote=git://git.example.com/project.git HEAD path/to/myfile |tar xf -
如果您需要标签中的特定文件,它是:
git archive --remote=git://git.example.com/project.git mytag path/to/myfile |tar xf -
听起来您正试图从集中式版本控制中继承一个想法,而 git 本质上不是 - 它是分布式的。如果您想使用 git 存储库,请克隆它。然后,您将拥有工作树的所有内容和所有历史记录(嗯,至少是指向当前分支顶端的所有内容),而不仅仅是单个文件或来自单个提交的快照。
git clone /path/to/repo
git clone git://url/of/repo
git clone http://url/of/repo
我添加此答案作为进行正式结帐或某些类似本地操作的替代方法。假设您可以访问 Git 提供程序的 Web 界面,您可能能够在给定的所需提交处直接查看任何文件。例如,在 GitHub 上,您可能会使用以下内容:
https://github.com/hubotio/hubot/blob/ed25584f/src/adapter.coffee
这ed25584f
是感兴趣的提交的 SHA-1 哈希中的前 8 个字符,然后是源文件的路径。
同样,在 Bitbucket 上我们可以尝试:
https://bitbucket.org/cofarrell/stash-browse-code-plugin/src/06befe08
在这种情况下,我们将提交哈希放在源 URL 的末尾。
我没有看到这里列出的对我有用的东西,所以如果有人遇到我的情况,我会把它包括在内。
我的情况是,我有一个可能包含 10,000 个文件的远程存储库,我需要为我的 Linux 系统构建一个 RPM 文件。RPM 的构建包括所有内容的 git clone。我只需要一个文件来启动 RPM 构建。我可以克隆完成我需要的整个源代码树,但是当我只需要一个文件时,下载所有这些文件需要额外的两分钟。我尝试使用讨论过的 git 存档选项,但得到“致命:协议不支持操作”。看来我必须在服务器上启用某种存档选项,而我的服务器由官僚暴徒维护,他们似乎喜欢让事情难以完成。
我最终所做的是进入 bitbucket 的 Web 界面并查看了我需要的一个文件。我右键单击链接以下载文件的原始副本,并从结果弹出窗口中选择“复制快捷方式”。我不能只下载原始文件,因为我需要使事情自动化,而且我的 Linux 服务器上没有浏览器界面。
为了讨论,这导致了 URL:
https://ourArchive.ourCompany.com/projects/ThisProject/repos/data/raw/foo/bar.spec?at=refs%2Fheads%2FTheBranchOfInterest
我无法直接从 bitbucket 存储库下载此文件,因为我需要先登录。经过一番挖掘,我发现这很有效: 在 Linux 上:
echo "myUser:myPass123"| base64
bXlVc2VyOm15UGFzczEyMwo=
curl -H 'Authorization: Basic bXlVc2VyOm15UGFzczEyMwo=' 'https://ourArchive.ourCompany.com/projects/ThisProject/repos/data/raw/foo/bar.spec?at=refs%2Fheads%2FTheBranchOfInterest' > bar.spec
这种组合使我能够下载构建其他所有内容所需的一个文件。
如果您只需要下载文件,则无需使用 Git 签出。
GitHub Mate这样做要容易得多,它是一个 Chrome 扩展程序,可以让您单击文件图标进行下载。也开源
如果您编辑了文件的本地版本并希望恢复到中央服务器上维护的原始版本,则可以使用Git Extensions轻松实现。
- 最初,该文件将被标记为提交,因为它已被修改
- 在文件树形菜单中选择(双击)文件
- 列出了单个文件的修订树。
- 选择树的顶部/头部并右键单击另存为
- 保存文件以覆盖文件的修改本地版本
- 该文件现在具有正确的版本,将不再标记为提交!
简单的!