我有大量数据要在全球 4 或 5 个站点上保持同步,每个站点大约 0.5 TB。这种变化(添加或更改)每天大约 1.4 GB,并且数据可以在四个站点中的任何一个站点发生变化。
很大一部分(30%)的数据是重复的包(可能是打包的 JDK),所以解决方案必须包括一种方法来识别本地机器上存在这样的东西并取而代之从另一个站点下载。
版本控制不是问题,这不是代码库本身。
我只是感兴趣是否有任何解决方案(最好是开源的)接近这样的事情?
我的使用 rsync 的婴儿脚本不再那么简单了,我想做更复杂、更智能的同步。
谢谢
编辑:这应该是基于 UNIX 的 :)