2

这是我得到的错误:

2015-12-11 04:01:47,306 ERROR org.apache.hadoop.hdfs.server.datanode.DataNode: anmol-vm1-new:50010:DataXceiver error processing WRITE_BLOCK operation  src: /10.0.1.193:57002 dst: /10.0.1.190:50010
org.apache.hadoop.net.ConnectTimeoutException: 65000 millis timeout while waiting for channel to be ready for connect. ch : java.nio.channels.SocketChannel[connection-pending remote=/10.0.1.192:50010]
        at org.apache.hadoop.net.NetUtils.connect(NetUtils.java:532)
        at org.apache.hadoop.net.NetUtils.connect(NetUtils.java:493)
        at org.apache.hadoop.hdfs.server.datanode.DataXceiver.writeBlock(DataXceiver.java:650)
        at org.apache.hadoop.hdfs.protocol.datatransfer.Receiver.opWriteBlock(Receiver.java:124)
        at org.apache.hadoop.hdfs.protocol.datatransfer.Receiver.processOp(Receiver.java:71)
        at org.apache.hadoop.hdfs.server.datanode.DataXceiver.run(DataXceiver.java:232)
        at java.lang.Thread.run(Thread.java:745)

http://pastebin.com/bP6W7P7y DataNode 日志(包含错误)

我附上了我当前看到的节点的两个屏幕截图以及我从 gridmix-generate.sh 看到的当前内容现在运行:

在此处输入图像描述 在此处输入图像描述

http://pastebin.com/jd12yDEk gridmix-生成运行时日志

在 yarn-site.xml 我们有这个: yarn.execution.optimistic-containers-policy only_conservative

我们在所有虚拟机中都有相同的 conf 文件夹。我们安装了 dstat。

知道什么可能是错误的或缺少什么,因为现在节点还没有关闭,但在执行过程中的某个地方节点会关闭并丢失。

最后是我们的纱线应用程序状态:http: //pastebin.com/WiMa0yRf

4

0 回答 0