在HDFS 架构指南的简单一致性模型部分下,它指出(强调我的):
HDFS 应用程序需要一个一次写入多次读取的文件访问模型。文件一旦创建、写入和关闭就无需更改。这种假设简化了数据一致性问题并实现了高吞吐量数据访问。Map/Reduce 应用程序或网络爬虫应用程序非常适合此模型。有计划在未来支持对文件的追加写入。
我对这里使用“不需要”感到困惑。它们的真正意思是“不得”或“不应该”吗?如果是这样,像 HBase 这样的程序如何提供更新支持?如果它们确实意味着“不需要”(即“不必”),那么试图传达什么?哪些文件系统要求您在写入后更改文件?