我的系统有以下部分:
- 暴露在 tcp 上的 ActiveMQ 代理,端口 61616
- 3 Grails/Spring 战争存在于他们自己的 Tomcat 服务器中,他们向 JMS 代理发布和消费消息
- n 次远程客户端系统,带有 JMS 侦听器组件以接收客户端特定消息,使用主机名和端口 61616 通过 VPN 连接到 JMS 代理
到目前为止,在开发、测试和生产环境中一切正常。
我们刚刚在生产中连接了一个新的客户端系统,我们注意到它的日志开始报告“通道长时间处于非活动状态”异常并断开连接。担心这个客户端的整体影响是它停止了代理上的所有消息消费,因此导致整个系统停止。
此客户端侦听器(使用 Spring 缓存连接工厂)似乎连接到 JMS 代理 ok,处理一些消息,然后 3 分钟报告异常。在 ActiveMQ 中打开 DEBUG 并获得大量输出,但几乎没有同时在代理上出现警告或错误。
相信 ActiveMQ 有一些内部保持活动,即使不活动的时间超过默认的 30 秒,也应该保持连接。
基础设施人员已经监控了这个客户端的 VPN,并确认它一直保持连接状态。
不要相信是代码或 Spring 配置有问题,因为我们在不同的客户端中有许多其他的侦听器实例,它们都表现得很好。
假设我真的有两个问题:
- 是什么导致“通道不活动”异常?
- 为什么单个客户端中的此异常会阻止 ActiveMQ 工作?
编辑 - 添加异常堆栈跟踪:
2013-04-24 14:02:06,359 WARN - Encountered a JMSException - resetting the underlying JMS Connection (org.springframework.jms.connection.CachingConnectionFactory)
javax.jms.JMSException: Channel was inactive for too (>30000) long: jmsserver/xxx.xx.xx.xxx:61616
at org.apache.activemq.util.JMSExceptionSupport.create(JMSExceptionSupport.java:49)
at org.apache.activemq.ActiveMQConnection.onAsyncException(ActiveMQConnection.java:1833)
at org.apache.activemq.ActiveMQConnection.onException(ActiveMQConnection.java:1850)
at org.apache.activemq.transport.TransportFilter.onException(TransportFilter.java:101)
at org.apache.activemq.transport.ResponseCorrelator.onException(ResponseCorrelator.java:126)
at org.apache.activemq.transport.TransportFilter.onException(TransportFilter.java:101)
at org.apache.activemq.transport.TransportFilter.onException(TransportFilter.java:101)
at org.apache.activemq.transport.WireFormatNegotiator.onException(WireFormatNegotiator.java:160)
at org.apache.activemq.transport.InactivityMonitor.onException(InactivityMonitor.java:266)
at org.apache.activemq.transport.InactivityMonitor$4.run(InactivityMonitor.java:186)
at java.util.concurrent.ThreadPoolExecutor$Worker.runTask(ThreadPoolExecutor.java:693)
at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:719)
at java.lang.Thread.run(Thread.java:813)
Caused by: org.apache.activemq.transport.InactivityIOException: Channel was inactive for too (>30000) long: jmsserver/xxx.xx.xx.xxx:61616
... 4 more