我正在研究 MPI 中 Quicksort 的并行实现的通信复杂性,我在一本书中发现了类似的内容:
“单个进程从其他 p-1 个进程中收集 p 个常规样本。由于传递的值相对较少,因此消息延迟很可能是这一步的主要术语。因此,收集的通信复杂度为 O(log p)"(O 实际上是一个 theta,p 是处理器的数量)。
对广播消息进行同样的确认。
为什么这些组通信复杂度为 O(log p)?是因为通信是使用某种基于树的层次结构完成的吗?
如果延迟不是主要术语并且正在发送大量数据怎么办?复杂度会是 O(n log (p)),其中 n 是发送数据的大小除以可用带宽吗?
而且,MPI_Send() 和 MPI_Recv() 的通信复杂度如何?
提前致谢!