0

作为我研究的一部分,我使用ScaLAPACK. 我有兴趣将实现的加速报告作为矩阵秩r及其带宽b的函数。

这将如何更好地实现?

这是我为这两个值选择的宇宙:

输入_{10,000 25,000 50,000 75,000 100,000 500,000 1,000,000 5,000,000 10,000,000}

{2 4 8 16 32 64 128 256 512 1024}

我使用的集群总共有 64 个核心,所以p{1, ..., 64}.

我已经计算了加速和效率,se,作为p的函数rb的函数。

我的目标是以某种方式显示加速是如何基于rb的加速性能如何。我正在考虑创建(r,b)空间的某种表面投影。但是我怎样才能在一个值中恢复加速的行为呢?

我的一个建议是使用达到的和理想的(线性)加速来计算 Pearson 相关系数,但是,这似乎不起作用,因为它没有考虑到出现的“加速最佳点”的存在r的较小值。

有什么提示吗?

提前致谢!

4

1 回答 1

1

在考虑了一段时间后,我决定报告最佳实现的加速乘以 Pearson 线性相关系数。

这样的情节如下所示:

在此处输入图像描述

(r,b) 的每个实例的最佳实现加速由它“接近线性”的程度加权,包含在 Pearson 线性相关系数中的信息。由于前者是在 [-1,1] 中定义的值,因此,对于远非线性的加速,我们将有一个 0,而负值将显示减速,这是预期的。在附图中,我们可以看到并行求解器确实会为较小的带宽值提供适当的可扩展性,并且随着该值的增加它会变得更糟。

如果你们有任何提示或任何更正,请告诉我;)

于 2013-05-08T01:38:26.840 回答