在我们的起搏器 + corosync 集群中
Last updated: Thu Oct 22 21:16:33 2015
Last change: Thu Oct 22 17:25:13 2015 via cibadmin on aws015
Stack: corosync
Current DC: aws015 (2887647247) - partition with quorum
Version: 1.1.10-42f2063
4 Nodes configured
16 Resources configured
我们有跟随情况。我们编写 python LSB 脚本,检查某些应用程序的状态,并将其作为资源:
primitive pm2_app_gardenscapesDynamo_lsb lsb:pm2_app_gardenscapesDynamo \
op start interval="0" timeout="60s" \
op stop interval="0" timeout="60s" \
op monitor interval="30s" timeout="60s" on-fail="restart" \
meta failure-timeout="10s" migration-threshold="1"
此检查由可以挂起的实用程序进行(LSB 脚本启动该实用程序,并等待它的回复)。因此,当起搏器超时时,它会杀死我们的 python 脚本,但挂起的实用程序仍然存在于内存中,并且不会死掉。
有可能防止这种情况吗?