3

给定一系列提交,比如HEAD~1and HEAD(即, just HEAD),我想找到在该范围内更改的行的先前作者以及他们更改了多少行。

更准确地说:对于范围内更改的每一行,我想获取以前的作者(git blame例如,使用 )。然后我想按这些作者总结更改的行进行分组。

例如,考虑这些人之前更改的文件 X HEAD(我在行首标记了更改行的人,与git blame的输出相当):

Adam: Lorem ipsum dolor 
Adam: sit amet, consectetur
Adam: adipiscing elit.
Bob:  Praesent efficitur urna
Bob:  ac volutpat lacinia.
Bob:  Sed sagittis, metus non
Adam: maximus tristique, leo
Adam: augue venenatis enim,
Adam: ac rutrum nulla odio
Adam: id urna.

现在,作者Carl将文件更改如下(请注意,这是git blame和的伪代码混合git diff):

Adam: Lorem ipsum dolor 
Adam: sit amet, consectetur
- Adam: adipiscing elit.
+ Carl: adipiscing elit I love cats.
- Bob:  Praesent efficitur urna
+ Carl: Praesent efficitur urna :D
- Bob:  ac volutpat lacinia.
+ Carl: ac volutpat lacinia YOLO.
+ Carl: Added extra line, lol!
- Bob:  Sed sagittis, metus non
Adam: maximus tristique, leo
Adam: augue venenatis enim,
Adam: ac rutrum nulla odio
Adam: id urna.

所以 Carl 改了 Bob 的 2 行,删除了 Bob 的 1 行,改了 Adam 的 1 行。因此,我的脚本的输出应该是:

鲍勃:3 亚当:1

我的整体解决方案是:

  1. 查找更改的行范围
  2. 将这些范围与-L参数一起传递git blame给以查询以前的作者
  3. 通过解析git blames 输出并总结自己进行最后的分组。

我目前正在努力解决 1.: 获取由 diff 更改的行范围(在本例中为一个范围 3,6)。一旦我有了这些范围,我可以将它们传递给git blame -L这些行的以前的作者。那么如何使git diff或其他 git 工具将行范围作为数字start,end对返回?

4

1 回答 1

4

我不知道如何告诉 Git 这样做,但我拼凑了一个解决方案来解析 的输出git diff以获得您需要的值。

如果你运行git diff -U0,在每个块的顶部你会看到这样的东西:

@@ -5,2 +5,3 @@

这意味着从第 5 行开始删除了 2 行,并在那里添加了 3 行。(-U0用于git diff隐藏所有上下文行的参数,以便仅打印实际更改的行。如果没有该参数,行号将不正确。)对于给定的块可能会出现三种不同的情况:添加了行,添加了行删除,或行被修改(删除和添加)。前面的示例显示了标题将为修改的行显示的内容。添加的行如下所示:

@@ -5,0 +6,2 @@

对于您的用例,我们可以忽略这些行。删除的行如下所示:

@@ -5,5 +4,0 @@

请注意,每对中的第二个数字是一个偏移量,显示添加/删除了多少行。值得庆幸的是,git blame它也可以接受该<end>值的偏移量,因此我们可以将其按摩成git blame可以接受的格式。

这是一个单行代码,应该可以解决问题:

git diff -U0 HEAD~1 -- $file | grep "^@@" | grep -Ev "@@ -[[:digit:]]+,0" | sed 's/^@@ //' | sed 's/ @@.*//' | cut -d' ' -f 1 | sed 's/[+-]//' | awk '{ if ($1 !~ /,/) { print $1",1" } else { print $1 } }' | sed 's/,/,+/'

解释:

  • $file是您正在处理的当前文件。

  • 第一个grep命令将输出限制为块头,第二个grep命令删除表示添加行的块。

  • 前两个sed命令删除范围行号以外的所有内容。

  • cut用于获取第一个范围值,即存在于HEAD~1其中的行不存在于HEAD.

  • 下一个sed命令去除前导状态字符。

  • 如果在给定的块中仅添加或删除一行,git diff将使用 eg+2作为范围而不是+2,1. 该awk命令解决了这个问题。

  • 最后,最后一个sed命令替换,为,,+以便git blame知道第二个值是偏移量而不是行号。

您可以使用单行输出的每一行(保存到 eg $row),如下所示:

git blame -L$row HEAD~1 -- $file
于 2017-06-30T00:52:13.063 回答