代码的想法是并行打开一个文件,然后每个内核读取该大文件的不同部分。ir_start
因此ir_stop
每个核心都不同。
我有以下代码(更大代码的一部分):
DO iq = 1, nqf
IF (MOD(iq,100) == 0) THEN
WRITE(stdout, '(a,i10,a,i10)' ) ' Progression iq (fine) = ',iq,'/',nqf
ENDIF
CALL MPI_FILE_OPEN (world_comm,filint,MPI_MODE_RDONLY,MPI_INFO_NULL,iunepmatwp2,ierr)
IF( ierr /= 0 ) CALL errore( 'xxxx', 'error in MPI_FILE_OPEN',1 )
DO ir = ir_start, ir_stop
CALL MPI_FILE_SEEK(iunepmatwp2,lrepmatw,MPI_SEEK_SET,ierr)
CALL MPI_FILE_READ(iunepmatwp2, aux, lrepmatw2, MPI_DOUBLE_PRECISION, MPI_STATUS_IGNORE,ierr)
loops:
eptmp ( ibnd, jbnd, ip, imode ) = aux (i)
endloops
CALL mp_sum(eptmp, world_comm)
ENDDO
something is then done with eptmp
ENDDO
代码系统崩溃的问题:
...
Progression iq (fine) = 32000/ 50000
Progression iq (fine) = 32100/ 50000
Progression iq (fine) = 32200/ 50000
Progression iq (fine) = 32300/ 50000
Progression iq (fine) = 32400/ 50000
Progression iq (fine) = 32500/ 50000
Progression iq (fine) = 32600/ 50000
error in MPI_FILE_OPEN
在我看来(我可能完全错了)可能有太多的通讯器打开。
问题是我不能CALL MPI_Comm_free(world_comm)
在q
-loop 中做类似的事情,因为它会杀死代码。
有没有办法让每个内核都使用相同的内核world_comm
而不创建新内核?