阅读本文后,使用 SHA-1 作为目录存储文件听起来是个好主意。
我不知道这意味着什么,但我只知道 SHA-1 和 MD5 是散列算法。如果我使用这个 ruby 脚本计算 SHA-1 哈希,并且我更改了文件的内容(这会更改哈希),那么我怎么知道文件的存储位置?
那么我的问题是,实现 SHA-1/文件存储系统的基础是什么?
如果所有文件一直在更改内容,是否有更好的存储它们的解决方案,或者您只需要不断更新哈希?
我只是在考虑如何创建一个通用的文件存储系统,如 GoogleDocs、Flickr、Youtube、DropBox 等,您可以在不同的环境中重复使用这些系统(例如存储PubMed 期刊文章或Cramster作业和测试,或者只是Flickr 上的图像)。我可能会将它们存储在 Amazon EC2 上。只是一些系统,所以我可以说“从现在开始,我将在 99% 的时间里进行文件存储”,这样我就可以停止考虑构建一种可靠/一致的方式来存储文件并解决一些实际问题。