1

我需要提高 MATLAB 代码的计算速度。为此,我使用英特尔 IPP 库在 C 语言上重写了我的程序,以进行向量操作。在这里我遇到了一个问题:在 MATLAB 中的一些主要计算循环程序和我的 C 程序进入不同的算法路径之后。发生这种情况是因为计算不完全相等,并且我的程序与 MATLAB 计算结果相比累积了错误。出于这个原因,我的程序没有计算正确的梯度,整个优化算法也算不上好。所以我的计算速度提高了,但计算效率降低了——当在第 100 步时,MATLAB 计算优化错误为 0.004,C 程序计算为 0.05,这对我的任务很重要。

我检查了哪个函数给了我错误,我发现了什么:常见操作(如 ippsAdd_64f_A53、ippsSub_64f_A53、ippsMul_f64_A53、ippsDiv_64f_A53 和通常的 C 操作、-、*、/)等于 MATLAB 结果并且总和错误为零,但 math.h双曲线函数在具有 75699 个元素的数组上给出了一个总和误差,约为 -3..-5e-13。英特尔函数 ippsCosh_64f_A53 和其他函数给出了大约 -1..-5e-14 的总和错误。

你知道计算高精度双曲和指数函数的库吗?或者也许 Visual Studio 2012 中有一些编译器设置可以帮助我?

在安装了 Intel Parallel Studio XE 2013 的 VS 2012 中以 Ipp64f 数据类型(双精度)进行的所有计算。

PS:总和误差是在 MATLAB 中计算的。我将数组从我的 C 程序保存到 4 级 mat 文件,然后导入到 MATLAB 中,我将 MATLAB 数组和导入数组之间的差异求和,例如 sum(M_cosh - C_cosh);

4

1 回答 1

1

不是答案,更多的是扩展评论:

你写

我需要提高 MATLAB 代码的计算速度

并问

你知道计算高精度三角函数和指数函数的库吗?

是的,我知道几个这样的库,但它们实现的浮点数比当前 CPU(主要是 32 位和 64 位)上通常提供的位数更多,并且在软件中实现了对这些数字的算术运算。为了您提高计算速度的目的,这些库是无用的,它们增加的精度是以增加执行时间为代价的。对于许多其他用户来说,这是一个合理的权衡。

我不知道有任何广泛使用或备受推崇的库在机器数上实现精度保持算法。这里没有空间详细介绍,但是对于问题的介绍,您可能比开始阅读Kahan 的求和算法更糟糕。

Mathworks 对于揭示 Matlab 实现的算法有些害羞。然而,Matlab 的大多数计算内核都是用 C(或 C++,我相信)编写并编译到库中的。其中许多现在也是多线程的。如果您试图编写代码以超越 Matlab,您将不得不编写多线程、高性能的数字代码。

得知 Matlab 实现的算法确实具有保持精度的能力,我一点也不感到惊讶。毕竟,Mathworks 试图为市场提供一种工具,该工具将解决广泛的问题,而用户不必考虑低级问题,例如机器精度是否足以解决特定问题的组合和数据集。

最后。尽管在速度上击败 Matlab 令人印象深刻,但您的第一次尝试不成功并不令我感到惊讶。我怀疑地期待当您报告成功时会感到惊喜,您自己的代码在时间上优于 Matlab 并产生令人满意的结果。

于 2013-11-10T10:00:57.477 回答