我写了一个非常简单的分布式计算平台(基于 Map/Reduce 范式),我正在编写一些演示和展示。我有一个非常小的团队,必须优先考虑我将首先编写哪些演示。
为了确定优先级,我需要对演示进行相应的排序,大约 70% 是分布式计算的相关、常见、重要的用例,30% 易于编写。
到目前为止,我已经这样订购了:
- 用 Monte Carlo 发现 pi 数字
- 与蒙特卡洛的数值积分
- 大矩阵乘法(密集矩阵)
- 线性回归
- 大矩阵求逆
- 多元回归
- 排序
- 聚类(K-均值)
- 聚类(分层)
排名第一是因为它花了 10 分钟来写,虽然它完全没用(我不确定,但我认为没有很多人试图找到更多的 pi 数字)。
由于我的平台的性质,它会在那些当然是令人尴尬的并行的事情上更加闪耀,而不是 I/O 受限或减少主导。
你会如何改变我的名单?你会添加什么?排序在企业世界中是否有用,还是仅用于对分布式计算平台进行基准测试?