1

我们知道,Hadoop 在 hdfs 中跨多个数据节点复制数据,是否有用于检查不同节点上的分布式数据的命令。

4

3 回答 3

1

我想你可能正在寻找这个命令

hdfs fsck /hdfs/path/to/data -files -blocks -locations

您将获得如下所示的报告。它报告所有块的列表、它们的复制因子以及这些块所在的主机集。

/hdfs/path/to/data/file.txt 4771082824 bytes, 36 block(s):  OK
0. BP-22525430-10.14.103.78-1355873316066:blk_-3400885615428218530_203522 len=134217728 repl=3 [10.14.103.213:50010, 10.14.102.190:50010, 10.14.102.176:50010]
1. BP-22525430-10.14.103.78-1355873316066:blk_124203196739652236_203523 len=134217728 repl=3 [10.14.103.213:50010, 10.14.102.190:50010, 10.14.102.176:50010]
2. BP-22525430-10.14.103.78-1355873316066:blk_5886188080028552249_203524 len=134217728 repl=3 [10.14.103.213:50010, 10.14.102.190:50010, 10.14.102.176:50010]
3. BP-22525430-10.14.103.78-1355873316066:blk_-3222807870390148132_203525 len=134217728 repl=3 [10.14.103.213:50010, 10.14.102.190:50010, 10.14.102.176:50010]
4. BP-22525430-10.14.103.78-1355873316066:blk_-1285830390698132620_203526 len=134217728 repl=3 [10.14.103.213:50010, 10.14.102.190:50010, 10.14.102.176:50010]
5. BP-22525430-10.14.103.78-1355873316066:blk_-2680874809037637827_203527 len=134217728 repl=3 [10.14.103.213:50010, 10.14.102.190:50010, 10.14.102.176:50010]
6. BP-22525430-10.14.103.78-1355873316066:blk_8699277646297360652_203528 len=134217728 repl=3 [10.14.103.213:50010, 10.14.102.190:50010, 10.14.102.176:50010]
7. BP-22525430-10.14.103.78-1355873316066:blk_-2195916588803548138_203529 len=134217728 repl=3 [10.14.103.213:50010, 10.14.102.190:50010, 10.14.102.176:50010]
[more]
于 2013-06-06T17:57:43.930 回答
1

您可以使用 hadoop 中可用的 Web 界面选项。使用它,您将能够查看有关 hdfs 的所有信息,存在多少节点,有多少是死/活的,存储使用情况等等。希望能帮助到你

于 2013-06-06T16:00:41.900 回答
1

您可以使用 localhost:50070/ 检查名称节点的运行状况。使用它可以浏览 hadoop 文件系统。

您还可以做一些其他的事情 localhost:50030 - JobTrack localhost:50060 - TaskTracker

于 2013-06-06T16:08:05.343 回答