我正在修复一个导致我们的 CI/CD 管道失败的错误。在集成测试期间,我们启动了一个本地数据库实例。为了做到这一点,我们使用一些 mariadb 包装器从 java 代码库中启动它。
这个过程可能(可能)需要很长时间才能完成,这将导致我们的测试超时。在这种情况下,我们添加了一个功能,如果进程无法在 20 秒内安装并应重试,则终止该进程。
这部分似乎正在工作。
尝试破坏进程时会出现奇怪的情况。似乎随机需要大约 2-3 分钟才能解锁。这是有问题的,原因与上述问题有问题的原因相同。
在对底层库进行调查后,我们似乎正在使用 ExecuteWatchdog 来管理进程。这是一些阻塞的代码是:
watchDog.destroyProcess();
// this part usually returns nearly instantly
try {
// this part can take minutes...
resultHandler.waitFor();
} catch (InterruptedException e) {
throw handleInterruptedException(e);
}
除此之外,Mac/Linux 上还有不同的行为。如果我做类似的事情resultHandler.waitFor(1000) // Wait with 1000ms timeout before just exiting
,它会在 macbook 上正常工作,但在 linux 上我会看到如下错误:java.io.FileNotFoundException: {{executable}} (Text file busy)
对此有什么想法吗?
我做了一些研究,似乎watchDog.destroyProcess
发送的是 SIGTERM 而不是 SIGKILL。但是我没有任何钩子来获取Process
对象以便将其发送 KILL 。
谢谢。