我正在运行 MPI 作业并收到以下警告消息:
[comet-05-08.sdsc.edu:mpi_rank_10][async_thread] Got unknown event 17 ... continuing ...
我正在使用 MVAPICH 2.1 编译 icc (ICC) 15.0.2 20150121。
消息是什么意思?它有害吗?
我正在运行 MPI 作业并收到以下警告消息:
[comet-05-08.sdsc.edu:mpi_rank_10][async_thread] Got unknown event 17 ... continuing ...
我正在使用 MVAPICH 2.1 编译 icc (ICC) 15.0.2 20150121。
消息是什么意思?它有害吗?
从这个邮件列表:
由于收到 IBV_EVENT_CLIENT_REREGISTER 事件(事件 #17),异步进度线程正在打印此错误消息。
建议您更新到最新版本。我链接到的邮件建议使用 MVAPICH2 1.4(比您的更新),尽管邮件来自 2009 年。
可能生成的代码是:
switch (event.event_type) {
...
break;
default:
NEM_IB_ERR("Got unknown event %d ... continuing ...",
event.event_type);
}
你可以在这里找到完整的代码。
如评论部分所示:
IBV_EVENT_CLIENT_REREGISTER
SM 请求客户端重新注册之前从该端口请求的所有订阅,例如(但不限于)加入多播组。该事件可能在 SM 发生故障导致其记录丢失或子网中有新的 SM 时产生。
仅当在 中设置了指示客户端重新注册的位时,设备才会生成此事件
port_attr.port_cap_flags
。
我不会对那个事件感到满意,所以如果我是你,我会更新。如果问题仍然存在,我会联系 MVAPICH2 人员。