8

我当前的生产服务器在过去几天刚刚启动时遇到问题。我正在运行 apache httpd-2.2.3 和 tomcat-5.5.20,与 mod_jk v1.3 连接,并在 tomcat 上托管了一个 Spring MVC 站点。正在发生的事情是,在启动大约 12 小时后,该网站为我们的用户挂起。当这第一次发生时,我可以在 catalina.out 中看到以下几个错误

WARN [org.apache.jk.core.MsgContext] Error sending end packet
java.net.SocketException: Broken pipe

在查看了这个之后,我了解到这意味着用户在请求完成之前取消了请求,因此返回路径已关闭,因此数据无法返回。从网上搜索看来,这可能会导致线程在 tomcat 中保持打开状态,直到达到超时。这似乎是有道理的,因为当 tomcat 倒下时,我在 catalina.out 日志的末尾

All threads (200) are currently busy, waiting. Increase maxThreads (200) or check the servlet status

建议是对 apache httpd.conf 中的 JkModule 设置进行以下更改

JkOptions +DisableReuse

我这样做是在确保它对我们的网站没有任何副作用并且第二天运行良好但昨天网站冻结时出现了相同的症状。然而这一次 catalina.out 中没有任何错误,我们只是停止通过 tomcat 接收请求。我可以从应用程序日志中看到它在 17:31 收到了最后一个请求,然后在 mod_jk.log 中我可以看到以下内容

[Thu Sep 06 17:37:07 2012] [18784:53792] [error] ajp_connection_tcp_get_message::jk_ajp_common.c (947): (worker1) can't receive the response message from tomcat, network problems or tomcat is down (127.0.0.1:8009), err=-104
[Thu Sep 06 17:37:07 2012] [18784:53792] [error] ajp_get_reply::jk_ajp_common.c (1536): (worker1) Tomcat is down or refused connection. No response has been sent to the client (yet)

然后在我的 httpd error_log

[Thu Sep 06 17:38:39 2012] [error] server reached MaxClients setting, consider raising the MaxClients setting

所以在我收到任何错误之前是 6 分钟,然后在最大客户端错误之前是 1 分钟 30 分钟。重新启动 tomcat 也解决了这个特殊问题。

除了我提到的(下面的当前配置)之外,我们的 apache、tomcat 或连接器配置没有任何更改,但我们对我们的站点进行了更改,以便为每个用户执行更多的 Ajax 请求。所以我想了解的是,我如何最好地分析我们的系统,以了解我可以做出哪些正确的设置更改,以确保我不会使我们的服务器超载,但确实阻止了这个问题的发生。

谢谢伊恩

当前配置

httpd.conf

Timeout 300
KeepAlive on
MaxKeepAliveRequests 100
KeepAliveTimeout 15

LoadModule jk_module modules/mod_jk.so
JkLogLevel    error
JkLogStampFormat "[%a %b %d %H:%M:%S %Y] "
JkOptions     +ForwardKeySize +ForwardURICompat -ForwardDirectories +DisableReuse

worker.properties

# Define 1 real worker using ajp13
worker.list=worker1
# Set properties for worker1 (ajp13)
worker.worker1.type=ajp13
worker.worker1.host=localhost
worker.worker1.port=8009
worker.worker1.lbfactor=50
worker.worker1.cachesize=10
worker.worker1.cache_timeout=600
worker.worker1.socket_keepalive=1
worker.worker1.recycle_timeout=300

httpd-mpm.conf

StartServers          5
MinSpareServers       5
MaxSpareServers      10
MaxClients          150 
MaxRequestsPerChild   0

Tomcat 设置只是标准的 Tomcat 设置

4

1 回答 1

3

原来答案是改变keepalive超时。为了阻止这种情况发生,我只需要将 KeepAliveTimeout 从 15 更改为 2 并添加 5000 的 MaxRequestsPerChild。我发现这阻止了这个问题再次发生

于 2013-06-12T00:40:15.900 回答