有什么公式可以告诉我们map reduce算法的并行效率吗?(换句话说,我如何在数学上证明 MR 算法 A 优于 MR 算法 B)
我用谷歌搜索了它,但我可以在wiki上找到并行算法的加速和效率的定义,但如果有人能展示这些公式如何应用于 MR 算法,那就太好了
有什么公式可以告诉我们map reduce算法的并行效率吗?(换句话说,我如何在数学上证明 MR 算法 A 优于 MR 算法 B)
我用谷歌搜索了它,但我可以在wiki上找到并行算法的加速和效率的定义,但如果有人能展示这些公式如何应用于 MR 算法,那就太好了
简而言之,请查看 Wiki 。Bulk Synchronous Parallel
BSP
另一个复杂度计算包含在 Rob Bisselings 论文中
并行科学计算:使用 BSP 和 MPI 的结构化方法
BSP
MapReduce
是对链接底部的复杂性/成本分析公式的抽象并包含。
所以你需要做的是,将你的MapReduce
算法转换为BSP
版本。障碍同步是例如阶段之间的转换Map
或Reduce
新MapReduce
作业。消息(通信)是您在Map
和Reduce
函数中向文件系统发出的内容。