我有一个似乎有重复提交的 github 存储库。每个提交具有相同的消息字符串和相同的日期/作者,但不同的 SHA-1 哈希和。例如,在我的日志中,我发现了以下四倍:
'commit 55e55517bf32b7ba7382b97f41a1514af8a5f5dc',
'Author: dermen <dermen@stanford.edu>',
'Date: Tue Feb 19 20:03:35 2013 -0800',
'finished with the cromermann edition',
'commit 814fb08e0d42588a500947cba42a980ac24c01b8',
'Author: dermen <dermen@stanford.edu>',
'Date: Tue Feb 19 20:03:35 2013 -0800',
'finished with the cromermann edition',
'commit a5f581f513d12e95627669f61cfe27064ffe8319',
'Author: dermen <dermen@stanford.edu>',
'Date: Tue Feb 19 20:03:35 2013 -0800',
'finished with the cromermann edition',
'commit a264614b674e1ad2c4c8cc953cb27cf77c0d2615',
'Author: dermen <dermen@stanford.edu>',
'Date: Tue Feb 19 20:03:35 2013 -0800',
'finished with the cromermann edition',
除了 SHA-1 散列之外,一切都是相同的。例如,当我跑步时
git diff 55e55517bf32b7ba7382b97f41a1514af8a5f5dc 814fb08e0d42588a500947cba42a980ac24c01b8
我得到零输出 - 这是否意味着提交是相同的。如果这是真的,那么他们为什么会有单独的 SHA-1 哈希和?也许我误解了,但 SHA-1 哈希不应该直接表示文件中的内容吗?因此,如果提交相等,那么它们应该具有相同的哈希值。
无论如何,我想知道尝试过滤这些明显的重复项是否明智/不明智......任何提示/重定向将不胜感激。