这是我最近在Web UI上看到的
Configured Capacity : 232.5 GB
DFS Used : 112.44 GB
Non DFS Used : 119.46 GB
DFS Remaining : 613.88 MB
DFS Used% : 48.36 %
DFS Remaining% : 0.26 %
而且我很困惑,非dfs Used占用了一半以上的容量,
我认为这意味着一半的 hadoop 存储被浪费了
在花费了无意义的时间搜索之后,我只是格式化了 namenode,并从头开始。
然后我将一个巨大的文本文件(大约 19 GB)从本地复制到 HDFS(成功)。
现在用户界面说
Configured Capacity : 232.5 GB
DFS Used : 38.52 GB
Non DFS Used : 45.35 GB
DFS Remaining : 148.62 GB
DFS Used% : 16.57 %
DFS Remaining% : 63.92 %
在复制之前,DFS Used 和 Non DFS Used 都是 0。
因为使用的 DFS 大约是原始文本文件大小的两倍,并且我配置了 2 个副本,
我猜 DFS Used 由原始和元的 2 个副本组成。
但是我仍然不知道 Non DFS Used 是从哪里来的,为什么它比 DFS Used 占用更多的容量。
发生了什么事?我犯错了吗?