我搜索网络(或分布式)文件系统的实现,如 Java 中的 NFS。目标是扩展它并用它做一些研究。在网上我找到了一些实现,例如DJ NFS,但悬而未决的问题是它们有多成熟和快速。
任何人都可以有一个好的起点,有没有人经历过这样的事情?
PS 我知道 Hadoop DFS,我将它用于一些项目,但 Hadoop 不适合我想在这里做的事情。
--EDIT-- Hadoop 真正专注于高度可扩展、高吞吐量的计算,而不会覆盖文件的某些部分等等。目标是您可以将文件系统用于用户主目录。
--EDIT-- 更多细节:想法是修改这样的实现,使文件不直接存储在本地文件系统上,而是应用重复数据删除。