-1

我有 IBM WebSphere Application 8.5 服务器与 Db2 11.1 一起工作 2 年。由于应用程序服务器挂起一个月,dB CPU 变为 0 并且应用程序服务器 CPU 变为 >80 ,并且在近 24 小时后挂起,同样的问题每天都在重复。在应用服务器上登录

db2diag 今天错误 2020-12-09-10.03.24.732486+120 I1234525159E610 LEVEL:错误 PID:5737 TID:139739072030464 PROC:db2sysc 0 INSTANCE:db2inst1 NODE:000 ff ff0x8.161 APPID:::ff0x8.161 APPPID: 42258.201209075007 UOWID:199 ACTID:1 AUTHID:DB2INST1 主机名:ERTUWCMDB1Az EDUID:1760 EDUNAME:db2agent (WPJCR) 0 功能:DB2 UDB,通用通信,sqlcctest,探针:50 消息:sqlcctest RC 数据 8 字节 9FCx02:007F17, 3600 6。

2020-12-09-10.03.24.732661+120 I1234525770E601 LEVEL: Error PID : 5737 TID : 139739072030464 PROC : db2sysc 0 INSTANCE: db2inst1 NODE : 000 DB : WPJCR APPHDL : 0-38161 APPID: ::ffff:x.42258.201209075007 UOWID : 199 ACTID:1 AUTHID:DB2INST1 主机名:ERTUWCMDB1Az EDUID:1760 EDUNAME:db2agent (WPJCR) 0 功能:DB2 UDB,基本 sys 实用程序,sqeAgent::AgentBreathingPoint,探针:10 CALLED:DB2 UDB,通用通信,sqlcctest RETCODE:ZRC= 0x00000036=54

[11/3/20 6:42:13:596 EET] 000006ad XATransaction E J2CA0027E: 在事务 ID {XidImpl: formatId(57415344), gtrid_length( 36), bqual_length(54),

data(000001758c648aa7000000082a775800f8c220c5f6bdab92156eae0be31e28ea7605ade8000001758c648aa7000000082a775800f8c220c5f6bdab92156eae0be31e28ea7605ade8000000010000000000000000000000000001)} : com.ibm.db2.jcc.am.XaException: [jcc][t4][2041][12326][4.25.13] Error executing XAResource.rollback(). 服务器返回 XAER_NOTA。错误代码=-4203,SQLSTATE=null

一段时间后,dB CPU 变为 0,应用程序服务器 CPU 变为 >80,并在近 24 小时后挂起,同样的问题再次出现。

这是由于数据损坏导致的死锁或锁定超时吗?

4

1 回答 1

0

在没有看到任何其他应用程序服务器日志的情况下,您的组合注意到

  1. “近 24 小时问题重复”
  2. sqeAgent::AgentBreathingPoint 错误( 有关更多信息,请参阅 IBM 技术说明https://www.ibm.com/support/pages/what-does-agentbreathingpoint-error-mean-db2 )
  3. “从 2 年开始工作。自一个月以来,应用程序服务器挂起”

会导致我在您的网络中寻找最近设置了连接超时的更改,在 24 小时后关闭连接。这可能是由于更换路由器或升级设置不同的固件造成的。这是否每天大约在同一时间发生,如果是,它是否发生在应用程序从安静状态(如过夜)到忙碌状态(如工作日开始)时?根据您的回答,听起来整个连接池在一夜之间变得“陈旧”,这意味着连接没有被使用并且网络超时导致它们与数据库服务器断开连接。您可以尝试将“最小连接数”的 WAS 数据源设置更改为 0,将“未使用超时”更改为 12 小时。当服务器流量停止时,这将允许连接池在一夜之间耗尽。随着应用程序在早上开始加载,将获得新的连接,从而避免错误。如果您的“最大连接数”设置非常大,当连接池被填满时,您可能会遇到一些缓慢。

于 2020-12-10T14:26:57.500 回答