问题标签 [openblas]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - CPU(直接将 Theano 绑定到 blas)更慢?
我已按照步骤https://www.kaggle.com/c/otto-group-product-classification-challenge/forums/t/13973/a-few-tips-to-install-theano-on-windows-64 -bits 在我的 Windows 机器上安装 theano,并运行 theano.misc.check_blas.test() 来测试 blas 速度,它运行大约 10 秒。
但是,如果我从 .theanorc.txt 文件中取出这些行,
结果将是(仅显示最后一个输出行):
为什么直接 Theano 绑定到 blas 比没有直接绑定要慢得多?我用的 blas 是不是错了?
(我按照上面链接的步骤下载并使用了 openblas - OpenBLAS-v0.2.14-Win64-int32.zip(可以从http://sourceforge.net/projects/openblas/files/v0.2.14/OpenBLAS下载) -v0.2.14-Win64-int32.zip/download),并保存到我的本地 C:\\openblas)
我还使用以下脚本进行了测试:
结果(绑定到openblas)也比NP慢:
c++ - 使用 MPI 和 Armadillo 在 C++ 中进行并行化
这是我的问题:openBLAS/LAPACK 库(在 Armadillo 库下)是否能够在 MPI 框架下利用并行性?
我担心的是,在使用 运行程序mpirun -np 1 executable
时,由于我特别要求操作系统仅使用一个处理器运行我的程序,我认为 openBLAS/LAPACK 将仅使用一个处理器而不是其他空闲的处理器来乘/加向量/矩阵。我是否限制 openBlas/LAPACK 在不同的处理器上执行多个线程-np 1
?如何使用通过选择的一个处理器上可用的不同内核-np 1?
python - 在服务器上安装 numpy
我在 namecheap 上有一个共享服务器。
Baiscally 我需要在它上面运行一个脚本。(我需要使用 android 调用它,这是第二部分。)
我所做的是安装miniconda
在我的服务器上。
如果我执行conda list
,我会得到以下信息。
这基本上说明它已安装在我的服务器上。
顺便说一句,我还按照他们的指南中的说明创建了一个环境。
现在的问题是我无法导入numpy
库(我的主要目标是导入pandas
库,但我认为它依赖于numpy
)。
我有一个名为servertest.py
内容的简单文件,如下所示。
当我运行它时,我收到以下错误
我什至尝试重新安装所有三个软件包,即openblas,numpy,pandas
.
谁能告诉我这里有什么问题?我怎样才能让它工作。
macos - 尝试在 Yosemite 中针对 openblas 编译 numpy,但 otool 显示我的构建与苹果的 Accelerate Framework 相关联
- 操作系统:优胜美地 10.10.5
- 使用 virtualenv,
- .bashrc/.bash_profile/.profile 全部为空
- 我已经简单地使用“make && make PREFIX=/usr/local/opt/openblas install”安装了openblas,这意味着它安装在/usr/local/opt/openblas
- CUDA 和 CuDNN 均已安装并经过测试。
cd ~/测试
ls
export PATH="/opt/local/bin:/opt/local/sbin:/usr/local/Cellar/bin:/usr/local/bin:$PATH"
导出 PATH="/Developer/NVIDIA/CUDA-7.5/bin:$PATH"
导出 DYLD_LIBRARY_PATH="/Developer/NVIDIA/CUDA-7.5/lib:$DYLD_LIBRARY_PATH"
导出 LDFLAGS=-L/usr/local/opt/openblas/lib
导出 CPPFLAGS=-I/usr/local/opt/openblas/include
激活我的 virtualenv 后,说 env1:
(env1)~>cd ~/test/numpy-1.10.4
(env1)numpy-1.10.4>cat site.cfg
(env1)>python setup.py 配置
(env1)numpy-1.10.4>python setup.py build --fcompiler=gnu95
(env1)numpy-1.10.4>python setup.py 安装
(env1)numpy-1.10.4>cd ~
(env1)~>python
(env1)~>otool -L ~/.virtualenvs/env1/lib/python2.7/site-packages/numpy/core/multiarray.so
=====================
那么问题是什么!!
为什么 numpy 仍然使用苹果的 Accelerate 框架而不是 openblas 构建?
如果我使用:
brew install numpy --with-openblas
一切都会好的,numpy.show_config() 和 otool 将显示它是针对 openblas 构建的,但是我需要确保在 virtualenv 中,brew install 不能保证它。
我已在此http://numpy-discussion.10968.n7.nabble.com/OpenBLAS-on-Mac-td36544.html中仔细阅读过, 但我仍然无法完成,我尝试重新创建 virtualenv 并且没有运气。
任何帮助将不胜感激!
dynamic-linking - 将程序与 OpenBLAS 和 IntelMKL 链接
由于英特尔 MKL 的 blas 库和 OpenBLAS 的库具有相同的接口,我发现我将程序链接到这些库的顺序会影响是调用 MKL 中的函数还是调用 OpenBLAS 中的函数。
实际上,我想有选择地调用 MKL 的矩阵乘法或 OpenBLAS 的矩阵乘法。
我怎样才能做到这一点?
c++ - 非方阵上的 Openblas cblas 分段错误
我在运行 openblas cblas 测试程序时遇到问题。我的 Cblas 在乘方矩阵时运行完美,但是当我尝试使用非方阵时,我收到错误“分段错误 - 核心转储”我检查并重新检查了尺寸问题,但它们似乎是正确的,所以我想知道可能是什么错误的。当我输入 m=200 而不是 m=300 时,它工作得很好。
例如,以下程序不起作用
非常感谢提前
openblas - 要求安装 OpenBLAS
我打算在 Mac OS 上安装 OpenBLAS,但最后似乎失败了。首先,我下载了源代码并将其解压缩,然后在终端上输入“make”命令。但是,我不能在它之后运行“make install”,它显示
. OpenBLAS 安装似乎还没有完成。我应该怎么办?谢谢。
c++ - OpenBLAS,'cblas_zdotc' 未声明?
我正在为 C++ 赋值编写代码。我是 OpenBlas 库的新手,想要一些关于如何应用它的指导。我检查了相关文档(https://software.intel.com/en-us/node/520736#A2C46A8C-343B-401D-88B6-9A6B88A4FA47),有趣的是,如果我尝试以下代码行我明白了
但是,如果我在文档中尝试 ddot 或其他函数,它们就会被声明。看:
这是预期的。我包括的库是:
我不确定为什么要声明 cblas_ddot 而不是 cblas_zdotc。我也尝试过非共轭版本,它也失败了。有关如何解决此问题的任何想法?
c++ - (C++) 如何在 C++ 中使用 OpenBlas 库?
抱歉,如果这一切看起来太简单了,但我是初学者,我正在尝试在 Windows 上的 C++ IDE“CodeBlocks”中使用 OpenBlas 库。更具体地说,我想使用矩阵向量乘法和求解三对角矩阵系统库。我已经下载了 OpenBlas 网站页面底部的文件。我什至不确定我会如何开始,因为像我这样的初学者在线资源很少/没有。我需要在我的 .cpp 文件序言中包含哪些库,我是否下载了正确的文件集,我需要在我的工作目录中包含哪些文件等?
提前致谢。
编辑:我已经按照建议下载了预建文件,并按照下面链接中的每一步操作。
http://www.learncpp.com/cpp-tutorial/a3-using-libraries-with-codeblocks/
我还在我的 .cpp 文件的序言中包含了#include "cblas.h",但是在我的构建消息中我得到一个未定义的对 'cblas_XXXXX' 错误的引用。这是什么原因?
c++ - 将 OpenBLAS 与 GSL 一起使用
在这两种情况下,我使用所有默认选项从源代码编译 GSL 和 OpenBLAS。我的 GSL 库安装在 /usr/local/lib 中,OpenBLAS 安装在 /opt/OpenBLAS/lib 中。如何在 C++ 中将 OpenBLAS 与 GSL 一起使用?
我这样做的主要原因是因为 OpenBLAS 使用了 Atlas 在默认配置中没有的所有内核。我的主要目标是将两个大矩阵 (10000 x 10000) 相乘并执行 2D 卷积。有没有更好的替代 OpenBLAS 或 GSL 的方法?
我在用:
- Linux Mint 17.2
- GCC 版本 4.8.4
- 20 核英特尔 CPU
我一直在用 OpenBLAS 在 Octave 中做同样的事情。使用 C++ 会显着提高性能吗?