将数据保存在 Hadoop 中并使用 Spark/Hive 等使用它是否可靠?
使用 HDFS 作为主存储有哪些优势?
HDFS 仅与维护文件元数据的 Namenode 一样可靠。你最好设置 Namenode HA 并经常拍摄它们的快照,并将它们存储在远离 HDFS 的外部。
如果所有 Namenode 都不可用,或者它们的元数据存储损坏,您将无法读取 HDFS 数据节点数据,尽管这些文件本身很好并且高度可用
以下是将数据存储在 Hive 与 HDFS(和/或 HBase)中的一些注意事项。
蜂巢:
HDFS/HBase:
相关帖子: