33

我想检索git 存储库中特定文件的所有先前版本。

我看到可以使用 checkout 命令获得一个特定版本,但我想要它们全部。带有深度选项的 git clone 命令似乎不允许我克隆子文件夹(“无效的存储库名称”)。

你知道这是否可能以及如何?

谢谢

4

6 回答 6

40

OP 想要检索所有版本,但无法提供答案。特别是如果文件有数百个修订版(所有建议都太手动了)。@Tobias 在评论中提出了唯一的半工作解决方案,但建议 bash 循环会以随机顺序构建文件,并且在针对我们的存储库使用时会生成数百个空文件。原因之一是“rev-list --all --objects”会列出不同的对象(包括树 - 但对我们的目的无用)。

我从 Tobias 的解决方案开始,添加了计数器,进行了一些清理,最后以下面列出的 bash 脚本的形式重新发明了轮子。

该脚本将:

  • 将所有文件版本提取到 /tmp/all_versions_exported
  • 取 1 个参数 - git repo 中文件的相对路径
  • 给结果文件名数字前缀(可排序)
  • 在结果文件中提到检查的文件名(以区分苹果和橙子:)
  • 在结果文件名中提及提交日期(参见下面的输出示例)
  • 不创建空结果文件

猫 /usr/local/bin/git_export_all_file_versions

#!/bin/bash

# we'll write all git versions of the file to this folder:
EXPORT_TO=/tmp/all_versions_exported

# take relative path to the file to inspect
GIT_PATH_TO_FILE=$1

# ---------------- don't edit below this line --------------

USAGE="Please cd to the root of your git proj and specify path to file you with to inspect (example: $0 some/path/to/file)"

# check if got argument
if [ "${GIT_PATH_TO_FILE}" == "" ]; then
    echo "error: no arguments given. ${USAGE}" >&2
    exit 1
fi

# check if file exist
if [ ! -f ${GIT_PATH_TO_FILE} ]; then
    echo "error: File '${GIT_PATH_TO_FILE}' does not exist. ${USAGE}" >&2
    exit 1
fi

# extract just a filename from given relative path (will be used in result file names)
GIT_SHORT_FILENAME=$(basename $GIT_PATH_TO_FILE)

# create folder to store all revisions of the file
if [ ! -d ${EXPORT_TO} ]; then
    echo "creating folder: ${EXPORT_TO}"
    mkdir ${EXPORT_TO}
fi

## uncomment next line to clear export folder each time you run script
#rm ${EXPORT_TO}/*

# reset coutner
COUNT=0

# iterate all revisions
git rev-list --all --objects -- ${GIT_PATH_TO_FILE} | \
    cut -d ' ' -f1 | \
while read h; do \
     COUNT=$((COUNT + 1)); \
     COUNT_PRETTY=$(printf "%04d" $COUNT); \
     COMMIT_DATE=`git show $h | head -3 | grep 'Date:' | awk '{print $4"-"$3"-"$6}'`; \
     if [ "${COMMIT_DATE}" != "" ]; then \
         git cat-file -p ${h}:${GIT_PATH_TO_FILE} > ${EXPORT_TO}/${COUNT_PRETTY}.${COMMIT_DATE}.${h}.${GIT_SHORT_FILENAME};\
     fi;\
done    

# return success code
echo "result stored to ${EXPORT_TO}"
exit 0

使用示例:
cd /home/myname/my-git-repo

git_export_all_file_versions docs/howto/readme.txt
    result stored to /tmp/all_versions_exported

ls /tmp/all_versions_exported
    0001.17-Oct-2016.ee0a1880ab815fd8f67bc4299780fc0b34f27b30.readme.txt
    0002.3-Oct-2016.d305158b94bedabb758ff1bb5e1ad74ed7ccd2c3.readme.txt
    0003.29-Sep-2016.7414a3de62529bfdd3cb1dd20ebc1a977793102f.readme.txt
    0004.28-Sep-2016.604cc0a34ec689606f7d3b2b5bbced1eece7483d.readme.txt
    0005.28-Sep-2016.198043c219c81d776c6d8a20e4f36bd6d8a57825.readme.txt
    0006.9-Sep-2016.5aea5191d4b86aec416b031cb84c2b78603a8b0f.readme.txt
    <and so on and on . . .>

编辑:如果你看到这样的错误:

致命:不是有效的对象名称 3e93eba38b31b8b81905ceaa95eb47bbaed46494:readme.txt

这意味着您不是从 git 项目的根文件夹启动脚本。

于 2017-01-24T17:23:20.003 回答
32

Dmitry 提供的脚本确实解决了这个问题,但它有一些问题导致我对其进行调整以更适合我的需要。具体来说:

  1. git show由于我的默认日期格式设置,使用了打破。
  2. 我希望结果按日期顺序排序,而不是逆日期顺序。
  3. 我希望能够针对已从存储库中删除的文件运行它。
  4. 我不希望所有分支上的所有修订;我只是想从 HEAD 获得修订。
  5. 如果它不在 git repo 中,我希望它出错。
  6. 我不想编辑脚本来调整某些选项。
  7. 它的工作方式效率低下。
  8. 我不需要输出文件名中的编号。(格式合适的日期也有同样的作用。)
  9. 我想要更安全的“带空格的路径”处理

您可以在我的 github 存储库中看到我修改的最新版本,或者这是撰写本文时的版本:

#!/bin/sh

# based on script provided by Dmitry Shevkoplyas at http://stackoverflow.com/questions/12850030/git-getting-all-previous-version-of-a-specific-file-folder

set -e

if ! git rev-parse --show-toplevel >/dev/null 2>&1 ; then
    echo "Error: you must run this from within a git working directory" >&2
    exit 1
fi

if [ "$#" -lt 1 ] || [ "$#" -gt 2 ]; then
    echo "Usage: $0 <relative path to file> [<output directory>]" >&2
    exit 2
fi

FILE_PATH="$1"

EXPORT_TO=/tmp/all_versions_exported
if [ -n "$2" ]; then
    EXPORT_TO="$2"
fi

FILE_NAME="$(basename "$FILE_PATH")"

if [ ! -d "$EXPORT_TO" ]; then
    echo "Creating directory '$EXPORT_TO'"
    mkdir -p "$EXPORT_TO"
fi

echo "Writing files to '$EXPORT_TO'"
git log --diff-filter=d --date-order --reverse --format="%ad %H" --date=iso-strict "$FILE_PATH" | grep -v '^commit' | \
    while read LINE; do \
        COMMIT_DATE=`echo $LINE | cut -d ' ' -f 1`; \
        COMMIT_SHA=`echo $LINE | cut -d ' ' -f 2`; \
        printf '.' ; \
        git cat-file -p "$COMMIT_SHA:$FILE_PATH" > "$EXPORT_TO/$COMMIT_DATE.$COMMIT_SHA.$FILE_NAME" ; \
    done
echo

exit 0

输出示例:

$ git_export_all_file_versions bin/git_export_all_file_versions /tmp/stackoverflow/demo
Creating directory '/tmp/stackoverflow/demo'
Writing files to '/tmp/stackoverflow/demo'
...

$ ls -1 /tmp/stackoverflow/demo/
2017-05-02T15:52:52-04:00.c72640ed968885c3cc86812a2e1aabfbc2bc3b2a.git_export_all_file_versions
2017-05-02T16:58:56-04:00.bbbcff388d6f75572089964e3dc8d65a3bdf7817.git_export_all_file_versions
2017-05-02T17:05:50-04:00.67cbdeab97cd62813cec58d8e16d7c386c7dae86.git_export_all_file_versions
于 2017-05-02T21:13:33.057 回答
8
git rev-list --all --objects -- path/to/file.txt

列出与 repo 路径关联的所有 blob

获取文件的特定版本

git cat-file -p commitid:path/to/file.txt

(commitid 可以是任何东西

  • 符号引用(分支、标签名称;也是远程)
  • 提交哈希
  • 修订规范,如 HEAD~3、branch1@{4} 等。
于 2012-10-11T23:25:22.423 回答
0

有时文件的旧版本只能通过git reflog. 我最近遇到了一种情况,我需要挖掘所有的提交,即使是那些因为在交互式变基期间意外覆盖而不再是日志一部分的提交。

我编写了这个 Ruby 脚本来输出文件的所有先前版本以找到孤立的提交。用 grep 的输出来追踪我丢失的文件很容易。希望它可以帮助某人。

#!/usr/bin/env ruby
path_to_file = ""
`git reflog`.split("\n").each do |log|
   puts commit = log.split(" ").first
   puts `git show #{commit}:#{path_to_file}`
   puts
 end

同样的事情可以用git log.

于 2015-02-07T04:33:58.527 回答
0

你可以使用git blame <file>.

也在这里:https ://docs.github.com/en/github/managing-files-in-a-repository/managing-files-on-github/tracking-changes-in-a-file

于 2021-07-02T19:52:31.227 回答
-2

当您 git clone 时,文件的所有版本都已经在 git repo 中。您可以创建与特定提交的签出关联的分支:

git checkout -b branchname {commit#}

这可能足以对更改进行快速而肮脏的手动比较:

  • 结帐到分支机构
  • 复制到编辑器缓冲区

这可能没问题,如果您只需要关注几个版本并且不介意一些手动操作,尽管是 git 内置命令。

对于脚本化解决方案,其他答案中已经提供了一些其他解决方案。

于 2012-10-11T23:23:56.710 回答