0

我需要取两个矩阵的 Kronecker 乘积,其中一个是单位矩阵,我的系统大小恰好是两个矩阵的 256*256 的数量级。尽管我编写了一个运行良好的代码,但问题在于系统大小。仅仅拿走产品就需要很多时间。我尝试开发 MPI 代码,但在将数据从一个内核发送和接收到另一个内核时遇到了问题。我不知道 MPI 的哪个例程对这项任务有效,如果有一些库使用 mpi 来评估张量积,如果有人可以帮助处理 mpi 张量积代码,那将会很有帮助。

4

0 回答 0