我在Ubuntu 14.04 64 位的硕士论文中成功使用了犰狳和OpenBLAS(安装了犰狳和未安装)。性能非常令人印象深刻——我的代码主要由基本的矩阵运算组成。所有这些都是使用所有可用的线程进行的。
现在我尝试在 Visual Studio 2013 的Windows 7 64 位机器上使用带有 OpenBLAS 的 Armadillo。我在网上找到了一些帮助并成功添加了PThread库。代码本身可以工作,但性能很差。我使用1000x1000矩阵测试了三个基本运算——加法、乘法和逐元素乘法。在这三个中,只有经典乘法会使用所有 CPU 能力。另外两个使用 25% 的 CPU,这表明它们在单线程上运行。
对于 Ubuntu,我没有遇到过这种行为。有人有什么建议吗?我没有看到任何链接,有人有类似的问题。