在删除超过 60 天的日志的例行日志修剪作业中,系统管理员将 CDH 从 4.3 升级到 4.6,(我知道,我知道)...
通常,日志修剪作业会释放大约 40% 的 HDFS 可用存储空间。然而,在升级过程中,datanodes 宕机了,被重启了,各种疯狂。
据了解,HDFS 收到了删除命令,因为 HDFS 文件/文件夹不再存在,但磁盘利用率仍然没有变化。
我的问题是,HDFS 是否可以从 NameNode 的元数据中删除文件,而不实际完成 DataNode 之间的文件块删除,从而有效地孤立文件块?