1

在集群环境中,我看到特定服务器的通道异常结束并在一天内频繁恢复。
例如:QMGR A 有几个 QMGRS(B,C,D,E,F) 连接到它。(每个在不同的服务器中)
来自 QMGR B、C、D、E、F 的集群接收器通道在 QMGR A 上异常结束并恢复一天之内相当频繁。

QMGR A 日志

    -------------------------------------------------- -----------------------------------------  
2012 年 8 月 4 日 08:44:41 - 进程(1720412.1165)用户(mqad)程序(amqrmppa)  
AMQ9209:与主机“HOST.B (139.120.210.19)”的连接已关闭。  

解释:  
通过 TCP/IP 从“HOST.B (139.120.210.19)”接收数据时出错。  
 与远程主机的连接意外终止。  
行动:  
告诉系统管理员。  
----- amqccita.c : 3094 ---------------------------------------- ---------------  
2012 年 8 月 4 日 08:44:41 - 进程(1720412.1165)用户(mqad)程序(amqrmppa)  
AMQ9999:通道程序异常结束。  

解释:  
频道节目“CHANNEL.TO.B”异常结束。  
行动:  
查看之前的通道程序“CHANNEL.TO.B”的错误消息  
错误文件以确定失败的原因。  
----- amqrccca.c : 777 ---------------------------------------- ----------------  
2012 年 8 月 4 日 08:44:41 - 进程(1720412.1175)用户(mqad)程序(amqrmppa)  
AMQ9209:与主机“HOST.C (155.10.186.20)”的连接已关闭。  

解释:  
通过 TCP/IP 从“HOST.C (155.10.186.20)”接收数据时出错。  
与远程主机的连接意外终止。  
行动:  
告诉系统管理员。  
----- amqccita.c : 3094 ---------------------------------------- ---------------  
2012 年 8 月 4 日 08:44:41 - 进程(1720412.1175)用户(mqad)程序(amqrmppa)  
AMQ9999:通道程序异常结束。  

解释:  
频道节目“CHANNEL.TO.C”异常结束。  
行动:  
查看之前通道程序“CHANNEL.TO.C”的错误消息  
错误文件以确定失败的原因。  
    -------------------------------------------------- -----------------------------------------  

主机 B 上的 QMGR 日志

08/04/2012 08:44:09 AM - 进程(17174.16023)用户(mqad)程序(amqrmppa)
AMQ9259:主机“HOST.A”的连接超时。

解释:
通过 TCP/IP 来自主机“HOST.A”的连接超时。
行动:
检查以查看未在预期时间内收到数据的原因。纠正
问题。重新连接通道,或等待重试通道重新连接
本身。
----- amqccita.c : 3546 ---------------------------------------- ---------------
08/04/2012 08:44:09 AM - 进程(17174.16023)用户(mqad)程序(amqrmppa)
AMQ9999:通道程序异常结束。

解释:
频道节目“CHANNEL.TO.B”异常结束。
行动:
查看之前的通道程序“CHANNEL.TO.B”的错误消息
错误文件以确定失败的原因。


主机 C 上的 QMGR 日志

-------------------------------------------------- -----------------------------------------
2012 年 8 月 4 日 08:44:35 - 进程(462890.4658)用户(mqad)程序(amqrmppa)
AMQ9259:主机“HOST.A”的连接超时。

解释:
通过 TCP/IP 来自主机“HOST.A”的连接超时。
行动:
检查以查看未在预期时间内收到数据的原因。纠正
问题。重新连接通道,或等待重试通道重新连接
本身。
----- amqccita.c : 3341 ---------------------------------------- ---------------
2012 年 8 月 4 日 08:44:35 - 进程(462890.4658)用户(mqad)程序(amqrmppa)
AMQ9999:通道程序异常结束。

解释:
频道节目“CHANNEL.TO.C”异常结束。
行动:
查看之前通道程序“CHANNEL.TO.C”的错误消息
错误文件以确定失败的原因。
----- amqrmrsa.c : 468 ---------------------------------------- ----------------

我试图了解是什么原因造成的?如果队列管理器 A 有尽可能多的连接超载,是否会导致?我没有在 qmgr 日志中看到任何 TCP/IP 错误代码。

4

1 回答 1

4

看起来您正在运行 MQ 的 V7.1 之前的版本?在 MQ V7.1 中,错误消息从以下位置更新:-

AMQ9259: Connection timed out from host 'HOST.A'.

EXPLANATION:
A connection from host 'HOST.A' over TCP/IP timed out.
ACTION:
Check to see why data was not received in the expected time. Correct the
problem. Reconnect the channel, or wait for a retrying channel to reconnect
itself.

AMQ9259: Connection timed out from host 'HOST.A'.

EXPLANATION:
A connection from host 'HOST.A' over TCP/IP timed out.
ACTION:
The select() [TIMEOUT] 60 seconds call timed out. Check to see why data was
not received in the expected time. Correct the problem. Reconnect the channel,
or wait for a retrying channel to reconnect itself.

举个例子。AMQ9259 错误消息的最可能原因是您的接收超时设置导致通道弹出其接收并关闭通道。建议您查看 qm.ini 文件中的接收超时设置,以查看它们是否设置为比您的心跳间隔更短的设置。

通道会自动重新启动,因为您在它们上定义了重试间隔。这很好!

于 2014-09-15T12:36:23.183 回答