繁体   English   中英

IOException:打开的文件太多

[英]IOException: Too many open files

我正在尝试在Linux上的Jetty 7.0.1中运行的Java webapp中调试文件描述符泄漏。

由于打开的文件过多而导致请求开始失败,应用程序已经愉快地运行了一个月左右,并且必须重新启动Jetty。

java.io.IOException: Cannot run program [external program]: java.io.IOException: error=24, Too many open files
    at java.lang.ProcessBuilder.start(ProcessBuilder.java:459)
    at java.lang.Runtime.exec(Runtime.java:593)
    at org.apache.commons.exec.launcher.Java13CommandLauncher.exec(Java13CommandLauncher.java:58)
    at org.apache.commons.exec.DefaultExecutor.launch(DefaultExecutor.java:246)

起初我认为问题在于启动外部程序的代码,但它使用的是commons-exec ,我没有看到它有什么问题:

CommandLine command = new CommandLine("/path/to/command")
    .addArgument("...");
ByteArrayOutputStream errorBuffer = new ByteArrayOutputStream();
Executor executor = new DefaultExecutor();
executor.setWatchdog(new ExecuteWatchdog(PROCESS_TIMEOUT));
executor.setStreamHandler(new PumpStreamHandler(null, errorBuffer));
try {
    executor.execute(command);
} catch (ExecuteException executeException) {
    if (executeException.getExitValue() == EXIT_CODE_TIMEOUT) {
        throw new MyCommandException("timeout");
    } else {
        throw new MyCommandException(errorBuffer.toString("UTF-8"));
    }
}

在服务器上列出打开的文件我可以看到大量的FIFO:

# lsof -u jetty
...
java    524 jetty  218w  FIFO        0,6      0t0 19404236 pipe
java    524 jetty  219r  FIFO        0,6      0t0 19404008 pipe
java    524 jetty  220r  FIFO        0,6      0t0 19404237 pipe
java    524 jetty  222r  FIFO        0,6      0t0 19404238 pipe

当Jetty开始时,只有10个FIFO,几天之后就有数百个。

我知道在这个阶段有点模糊,但你有什么建议在下一步看,或者如何获得有关这些文件描述符的更详细的信息?

问题来自您的Java应用程序(或您正在使用的库)。

首先 ,您应该阅读整个输出(Google for StreamGobbler)和pronto!

Javadoc说:

父进程使用这些流向子进程提供输入并从子进程获取输出。 由于某些本机平台仅为标准输入和输出流提供有限的缓冲区大小,因此无法及时写入输入流或读取子进程的输出流可能导致子进程阻塞甚至死锁。

其次waitFor()你的进程终止。 然后,您应该关闭输入,输出和错误流。

最后 destroy()你的过程。

我的来源:

当你在Linux上运行时,我怀疑你的文件描述符已经用完了。 查看ulimit。 这篇文章描述了这个问题: http//www.cyberciti.biz/faq/linux-increase-the-maximum-number-of-open-files/

您的外部程序行为不正常。 看看它为什么不这样做。

不知道你的应用程序的性质,但我已经看到这个错误多次出现,因为连接池泄漏,所以这是值得检查。 在Linux上,套接字连接使用文件描述符和文件系统文件。 只是一个想法。

除了查看文件泄漏等根本原因问题,以便合法增加“打开文件”限制并在重新启动后保持这种限制,请考虑编辑

/etc/security/limits.conf

通过添加这样的东西

jetty soft nofile 2048
jetty hard nofile 4096

其中“jetty”是这种情况下的用户名。 有关limits.conf的更多详细信息,请参阅http://linux.die.net/man/5/limits.conf

注销然后再次登录并运行

ulimit -n

验证更改是否已发生。 此用户的新流程现在应该符合此更改。 此链接似乎描述了如何对已经运行的进程应用限制,但我还没有尝试过。

对于大型Java应用程序,默认限制1024可能太低。

你可以自己处理fds。 java中的exec返回一个Process对象。 间歇性地检查进程是否仍在运行。 一旦完成,关闭进程STDERR,STDIN和STDOUT流(例如proc.getErrorStream.close())。 这将减轻泄漏。

当您同时在许多文件中写入数据并且操作系统具有固定的Open文件限制时,会出现此问题。 在Linux中,您可以增加打开文件的限制。

https://www.tecmint.com/increase-set-open-file-limits-in-linux/

如何更改Linux中的打开文件数限制?

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM