最近,我读到一篇题为“SATA vs. SCSI 可靠性”的文章。它主要讨论消费级 SATA 驱动器中非常高的位翻转率,并得出结论“您现在无法从特定磁盘读取所有数据的可能性为 56%”。甚至 Raid-5 也无法拯救我们,因为它必须不断地扫描它是否有问题,如果磁盘确实死了,你几乎可以保证在重建的文件系统上有一些翻转的位。
注意事项:
我听说过 Sun 的ZFS with Raid-Z,但 Linux 和 BSD 的实现仍处于试验阶段。我不确定它是否已准备好迎接黄金时段。
我还阅读了很多关于Par2文件格式的内容。似乎与每个文件一起存储一些额外的 % 奇偶校验可以让您从大多数问题中恢复。但是,我不知道在内部执行此操作的文件系统,并且似乎很难管理单独的文件。
备份(编辑):
我知道备份是最重要的。但是,如果没有进行某种检查,您可能很容易在不知情的情况下向人们发送不良数据。此外,确定哪个备份具有该数据的良好副本可能很困难。
例如,您有一个运行了一年的 Raid-5 阵列,您发现了一个损坏的文件。现在你必须回去检查你的备份,直到你找到一个好的副本。理想情况下,您会转到包含该文件的第一个备份,但这可能很难弄清楚,特别是如果该文件已被多次编辑。更糟糕的是,考虑该文件是否在损坏发生后被附加或编辑。对于 Par2 等块级奇偶校验,仅此一项就足够了。