我正在尝试检测 MPI 中的死锁
有什么方法可以让我们在特定时间后从像 MPI_Recv 这样的函数跳转。
MPI_Recv 是一个阻塞函数,它只会坐在那里,直到它接收到它正在等待的数据,所以如果你想让它超时并在事情锁定时出错,那么我认为这不适合你。
您可以查看 using MPI_Irecv
,这是非阻塞版本。然后,您可以模拟MPI_Recv
usingMPI_Wait
或的阻塞行为MPI_Test
。
如果您使用 和 的组合,MPI_Irecv
您MPI_Test
可以制作一个等待接收指定时间长度的片段,如果没有,则会出错。粗略的例子:
MPI_Irecv(..., &request); //start a receive request, non-blocking
time_t start_time = time(); //get start time
MPI_Test(&request, &gotData, ...); //test, have we got it yet
//loop until we have received, or taken too long
while (!gotData && difftime(time(),start_time) < TIMEOUT_TIME) {
//wait a bit.
MPI_Test(&request, &gotData, ...); //test again
}
//By now we either have received the data, or taken too long, so...
if (!gotData) {
//we must have timed out
MPI_Cancel(&request);
MPI_Request_free(&request);
//throw an error
}