对于包含不一致行结尾以及带有 ascii 和 UTF-8(带 BOM)的文件编码的大型现有存储库...
关键是当前的文件集相当不一致。它们的编码不同。(让我们暂时忽略 UTF-16,尽管我也有一些)。它们的行尾因文件而异,而且文件本身的行尾也不同,尽管我怀疑它们中的大多数都以 crlf 行尾存储在 git 中。
这里有两个主要问题:
1)使用相同存储库的不同人可以查看更改,他们会看到一组不同的更改。有时,由于规范化的行结尾,“整个文件”已被更改。有时只更改了文件的一部分。这似乎主要取决于 core.autocrlf 是否已设置为 true 或 false,并且似乎还受到使用 .gitattributes 文件的影响。
2)我希望所有人都能够将文件提交到 git 存储库,而不必费力地关注他们的特定 git 配置是否已设置为进行 crlf 转换,或者他们的文本编辑器、IDE 或他们决定使用的任何工具采用。(尽管这种行为可能在 Windows 上被破坏,但我们需要忍受它......)
主要问题是:我如何确定 'gitk'、'git diff'、'git show' 等显示的输出与显示的更改绝对一致。我不太关心这里的行尾,更关心的是确保给定提交的“更改”与所有开发人员看到的更改相同。我不希望一个人看到一个变化,看到“所有的行都变了”(即行尾都变了),而另一个人看到了同样的变化,说:“三行都变了”。
- 注意:有些人使用 github 来查看更改。
也就是说,我想有信心知道如何关注行尾,所以我最终要问的是如何知道行尾会发生什么。例如,如果我在 .gitattributes 中为给定文件指定“eol=crlf”,这是否意味着该文件使用该设置提交给 git?如果我检查在设置 .gitattributes 文件之前提交的该文件的早期版本,会发生什么?