23

我有一个在 tomcat 上运行的应用程序,有时会出现以下错误:

SEVERE: Socket accept failed
java.net.SocketException: Too many open files
at java.net.PlainSocketImpl.socketAccept(Native Method)
at java.net.AbstractPlainSocketImpl.accept(AbstractPlainSocketImpl.java:398)
at java.net.ServerSocket.implAccept(ServerSocket.java:522)
at java.net.ServerSocket.accept(ServerSocket.java:490)
at org.apache.tomcat.util.net.DefaultServerSocketFactory.acceptSocket(DefaultServerSocketFactory.java:60)
at org.apache.tomcat.util.net.JIoEndpoint$Acceptor.run(JIoEndpoint.java:216)
at java.lang.Thread.run(Thread.java:722)

……

SEVERE: Error processed default web.xml named conf/web.xml at /local/myApp/apache-tomcat/conf/web.xml
java.io.FileNotFoundException: /local/myApp/apache-tomcat/conf/web.xml (Too many open files)
        at java.io.FileInputStream.open(Native Method)
        at java.io.FileInputStream.<init>(FileInputStream.java:138)
        at org.apache.catalina.startup.ContextConfig.getWebXmlSource(ContextConfig.java:1838)
        at org.apache.catalina.startup.ContextConfig.getGlobalWebXmlSource(ContextConfig.java:1745)
        at org.apache.catalina.startup.ContextConfig.getDefaultWebXmlFragment(ContextConfig.java:1418)
        at org.apache.catalina.startup.ContextConfig.webConfig(ContextConfig.java:1253)
        at org.apache.catalina.startup.ContextConfig.configureStart(ContextConfig.java:878)
        at org.apache.catalina.startup.ContextConfig.lifecycleEvent(ContextConfig.java:369)
        at org.apache.catalina.util.LifecycleSupport.fireLifecycleEvent(LifecycleSupport.java:119)
        at org.apache.catalina.util.LifecycleBase.fireLifecycleEvent(LifecycleBase.java:90)
        at org.apache.catalina.core.StandardContext.startInternal(StandardContext.java:5269)
        at org.apache.catalina.util.LifecycleBase.start(LifecycleBase.java:150)
        at org.apache.catalina.core.StandardContext.reload(StandardContext.java:3926)
        at org.apache.catalina.loader.WebappLoader.backgroundProcess(WebappLoader.java:426)
        at org.apache.catalina.core.ContainerBase.backgroundProcess(ContainerBase.java:1345)
        at org.apache.catalina.core.ContainerBase$ContainerBackgroundProcessor.processChildren(ContainerBase.java:1530)
        at org.apache.catalina.core.ContainerBase$ContainerBackgroundProcessor.processChildren(ContainerBase.java:1540)
        at org.apache.catalina.core.ContainerBase$ContainerBackgroundProcessor.processChildren(ContainerBase.java:1540)
        at org.apache.catalina.core.ContainerBase$ContainerBackgroundProcessor.run(ContainerBase.java:1519)
        at java.lang.Thread.run(Thread.java:722)

我检查了打开文件的限制,它是 1024,但是当我使用 lsof 检查应用程序的打开文件数时,它接近 200,如果它没有达到限制,为什么会发生这种情况?我应该提高限额吗?还有其他原因会导致此错误吗?让服务再次正常运行的唯一方法是重新启动tomcat,还有另一种恢复正常的方法吗?

提前致谢。

编辑:这是处理 doPost 方法的 servlet,一开始我没有关闭每个流,可能是这样吗?为此,我添加了 finally 语句:

    InputStream is = null;
    DataInputStream dis = null;
    OutputStream os = null;
    DataOutputStream dos = null;
    String paramName = "";
    try {
        os = response.getOutputStream();
        is = request.getInputStream();
        dis = new DataInputStream(is);
        dos = new DataOutputStream(os);
        .....
        }catch (Throwable e) {
        LOGGER.error(e.getMessage());
        } finally {
          if (dis != null) {
             dis.close();
           }
           else if(is != null) {
             is.close();
           }                
           if (dos != null) {
             dos.close();
           }
           else if( os != null) {
             os.close();
           }
        }

EDIT2: 在进行了一些测试之后,我意识到如果我先关闭 DataInputStream 然后再关闭 InputStream,我会在通信的另一部分中获得消息前的一个数字(我不知道为什么)。我更改了关闭流的顺序,似乎一切正常。但我仍然有问题。任何想法?

  finally {

    if(is != null) {
        try {
            is.close();
        } catch (IOException e) {
            LOGGER.error(e.getMessage());
        }
    }
    if (dis != null) {
        try {
            dis.close();
        } catch (IOException e) {
            LOGGER.error(e.getMessage());
        }
    }
    if(os != null) {
        try {
            os.close();
        } catch (IOException e) {
            LOGGER.error(e.getMessage());
        }
    }
    if (dos != null) {
        try {
            dos.close();
        } catch (IOException e) {
            LOGGER.error(e.getMessage());
        }
    }
}
4

5 回答 5

19

执行以下操作以获取 tomcat7 的 pid,例如 1234

ps aux |grep tomcat7

然后做

cat /proc/1234/limits阅读如下一行

Max open files 16384 16384 files

这些是 Tomcat 允许的最大打开文件数。要增加它,请按照以下说明进行操作

Tomcat 打开的文件太多。

于 2015-03-10T15:12:52.970 回答
11

按照以下说明快速分析服务器的当前配置并调整 tomcat 硬限制和软限制以解决此问题。

这将显示该进程的所有打开文件。

ls -l /proc/tomcatPID/fd 

这将显示打开文件的计数。

ls -l /proc/tomcatPID/fd | wc -l 

增加打开文件限制更新/etc/security/limits.conf

要检查特定于 tomcat 的打开文件的数量:

硬限制:su - tomcat -c 'ulimit -Hn' -s '/bin/bash'

软限制:su - tomcat -c 'ulimit -Sn' -s '/bin/bash'

您可以使用玉米作业运行以下脚本以了解打开文件的详细信息。

=============================
#!/bin/bash

PID=$(ps -ef|grep tomcat6|grep -v grep |awk '{print $2}')
value=$(ls -l /proc/$PID/fd | wc -l)
echo `date`@$PID:$value >> /usr/local/filecount.txt
if [ $value -gt 2000 ];
then
printf "\n\n\n\n\n" >> /usr/local/files_report.txt
echo "-------------------------------`date`--Starting Session----------------------" >> /usr/local/files_report.txt
openfiles=$(ls -l /proc/$PID/fd | awk '{print NR,$11 "" >> "/usr/local/files_report.txt"}')
echo "--------------------`date`---Ending  Session ------------------------------" >> /usr/local/files_report.txt
fi
================= 
于 2017-12-21T13:15:00.877 回答
10

知道您可以通过将以下内容添加到以下内容来更改打开文件的限制可能会很有用/etc/security/limits.conf

* soft nofile 2048 # Set the limit according to your needs
* hard nofile 2048

然后您可以sysctl -p在 shell 上使用重新加载配置。检查这篇文章

只是为了完整性,您可以使用以下方法验证打开文件的当前限制是多少:ulimit -n

于 2014-07-02T15:30:12.763 回答
4

@gaboroncancio 发布的答案基本上是正确的,但他关于如何使设置生效的建议并不完全正确。sysctl -p将重新加载/etc/sysctl.conf,或者您作为参数传入的任何文件。但是,该sysctl命令将无法识别/etc/security/limits.conf.

要重新加载/etc/security/limits.conf,您只需注销并重新登录。

于 2015-11-30T16:04:32.977 回答
1
  1. 如果此代码来自网络操作(套接字),我不确定 Java XXxxxStrem 与操作系统文件限制有 1:1 的关系(或根本没有关系)。也许需要一些研究,异常消息有错误的文本?经常出现在软件中。

  2. 我的直觉说,我们不理解异常 2,代码中没有任何内容(或问题中没有配置)有关系。

  3. 当软件错误(泄漏)是主要问题时扩展操作系统文件限制是错误的策略,正如您理解的那样

于 2015-09-09T08:39:39.887 回答