3

对于包含不一致行结尾以及带有 ascii 和 UTF-8(带 BOM)的文件编码的大型现有存储库...

关键是当前的文件集相当不一致。它们的编码不同。(让我们暂时忽略 UTF-16,尽管我也有一些)。它们的行尾因文件而异,而且文件本身的行尾也不同,尽管我怀疑它们中的大多数都以 crlf 行尾存储在 git 中。

这里有两个主要问题:

1)使用相同存储库的不同人可以查看更改,他们会看到一组不同的更改。有时,由于规范化的行结尾,“整个文件”已被更改。有时只更改了文件的一部分。这似乎主要取决于 core.autocrlf 是否已设置为 true 或 false,并且似乎还受到使用 .gitattributes 文件的影响。

2)我希望所有人都能够将文件提交到 git 存储库,而不必费力地关注他们的特定 git 配置是否已设置为进行 crlf 转换,或者他们的文本编辑器、IDE 或他们决定使用的任何工具采用。(尽管这种行为可能在 Windows 上被破坏,但我们需要忍受它......)


主要问题是:我如何确定 'gitk'、'git diff'、'git show' 等显示的输出与显示的更改绝对一致。我不太关心这里的行尾,更关心的是确保给定提交的“更改”与所有开发人员看到的更改相同。我不希望一个人看到一个变化,看到“所有的行都变了”(即行尾都变了),而另一个人看到了同样的变化,说:“三行都变了”。

  • 注意:有些人使用 github 来查看更改。

也就是说,我想有信心知道如何关注行尾,所以我最终要问的是如何知道行尾会发生什么。例如,如果我在 .gitattributes 中为给定文件指定“eol=crlf”,这是否意味着该文件使用该设置提交给 git?如果我检查在设置 .gitattributes 文件之前提交的该文件的早期版本,会发生什么?

4

2 回答 2

2

好的,这是正在发生的事情:

第一:差异看起来总是一样的,不依赖于本地 git 配置。您可以尝试:git diff HEAD^ HEAD在您的所有机器上看起来都一样(假设它们具有相同的 HEAD)。

但是为什么差异在你的机器上看起来不一样呢?假设您的存储库中有一个文件,看起来完全像这样:

two \r\n lines

签出在每台机器上都是这样的。但在办理登机手续时,有两种选择:

  1. 行尾归一化已打开。该文件现在将检入为:

    two \n lines
    

    并且git diff会报告说会有变化

  2. 行尾归一化已关闭。该文件将检入为:

    two \r\n lines
    

    并且git diff不会报告任何更改。


现在,您如何确保每个人都看到相同的变化?我建议为每个人启用行尾标准化。为此.gitattributes,请使用以下内容在您的存储库的根目录中创建一个:

*   text=auto

并将这个文件提交到每个分支。一旦每个人都取消了这个提交,差异在任何地方都会看起来一样。


最后说明:core.eol对此没有任何影响。它只会更改工作目录中的行尾。git diff不会将工作目录与索引进行比较,但会区分针对索引提交的内容。

于 2013-02-15T17:35:27.767 回答
1

我假设你会用谷歌搜索“git line endings”来了解如何进行基本的 repo 设置。

你根本无法影响任何已经承诺的事情。您唯一能做的就是使用您喜欢的任何固定文件内容进行新的提交。

从您在下面的评论中,您所追求的是能够完全忽略行尾差异。请参阅此处此处,了解我能找到的最好的以前的 stackoverflow 答案。

于 2013-02-11T03:43:19.517 回答