问题标签 [intel-mkl]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
multithreading - 阿尔格。MKL 螺纹 DGEMV
众所周知,有很多不同的方法可以并行实现 DGEMV(按列或按块等),从而导致不同的通信开销。我一直在查看 MKL 和 BLAS 的所有参考手册,试图找出 cblas_dgemv 通常从 MKL(v.11) 调用哪种样式但没有成功。如果有人有参考文献记录了正在使用的算法或算法的开销,我会非常高兴。
python - ubuntu 12.04 上的 python matplotlib MKL 致命错误
这是我的python代码
当我运行它时,我收到以下错误消息
这是我的python版本。
visual-studio-2010 - 使用 Visual Studio 编译的英特尔 MKL Pardiso 求解器
我正在尝试创建一个简单的示例,以便在 MKL 英特尔库中使用 Pardiso 求解器。我一直在按照提供的示例进行操作,但是如果我将对 Pardiso 的调用放在子例程中,它将不起作用。恐怕这与 INCLUDE 语句或链接方面有关。
所有子程序使用的数组都包含在一个名为 variables 的模块中
包含程序的文件如下:
最后是文件 initpardiso
现在,我还在 Visual Studio 项目配置中添加了 Additional Include Directories(即
如果我评论对 pardiso 的调用,一切正常,否则它将停止编译并出现此错误:
错误 1 错误 #6285:此通用子例程调用没有匹配的特定子例程。[PARDISO_64] ....PardisoFortran\initpardiso.f 144
有什么想法吗?这是顶部的 INCLUDE 语句的问题吗?我应该在哪里包括它?
mpi - 如何将 MKL 与 MPI 链接?
我想用 MKL 编译这个 C 代码,但是当我使用 command 运行它时mpicc -mkl mkl_thread.c
,它给了我一个关于 unrecognized command line option 的错误-mkl
。当我mpicc mkl_thread.c -o mkl_thread
以 . 我不知道如何使用 MKL 运行或链接它。
我的代码是:
fortran - 在 fortran 中处理分层稀疏矩阵
介绍
我正在用 Fortran 开发一个代码,通过对线性算子进行预处理来解决 MHD 问题。待反转的稀疏矩阵可以认为是以下层次结构的矩阵。原始矩阵(例如,A_1)是块的带状矩阵。A_1 的每个块都是相同结构(即块带状矩阵)的稀疏矩阵(例如,A_2)。A_2 的每个块又是相同稀疏结构 A_3 的块带状矩阵。最后,A_3 的每个块是一个 5 x 5 的密集矩阵 A_4。我发现这种分层表示对于初始化矩阵的元素非常方便。
问题
我想知道是否存在一个库(在 Fortran 中)允许处理这种结构并将其转换为标准稀疏矩阵格式之一(CSR、CSC、BSR、...),因为 Sparse BLAS 或 MKL Pardiso 将用于反转它。让我强调一下,我的意图是仅使用层次结构来初始化矩阵的元素。当然,层次结构可以忽略,矩阵可以硬编码为 CSR 格式,但我发现这太耗时,无法实现和测试。
注释
我不期望线性求解器使用分层结构,尽管在 S. Pissanetsky “稀疏矩阵技术”,1984 年,学术出版社,第 27 页(可在此处在线获得)中提到了此类存储方案,即“超矩阵”和“超稀疏”存储方案,并用于高斯消除。我还没有找到这些方案的可用实现。
块压缩稀疏行 (BSR) 格式(由 MKL 支持)可用于处理两层矩阵,A_3(sparse) + A_4(dense),仅此而已。
intel-mkl - mkl_set_num_threads() 没有相应地工作
我想为每个节点(同一个集群)的每个进程创建不同的 MKL 线程数。以这种方式在输入文件中提供每个进程的线程数。
主机线程
主机名_1 t=4
主机名_2 t=7
主机名_3 t=2
我的代码是这样的:
当我建立每个节点的性能模型时。它对所有人显示相同的结果。相反,具有更多线程的进程应该更快。有人可以帮助我为什么 mkl_set_num_threads(threads) 无法正常工作。或者我如何检查以确保在该函数之后创建所需的线程数?
matlab - 在 MEX 中使用 MKL 头文件/库文件
我一直在尝试Intel MKL
在 MATLAB 的 mex 文件中使用。我使用以下开关能够编译和链接,但没有成功。
我收到以下错误
有人可以帮我吗?
lapack - EPD Free 发行版是否使用 MKL?
根据 Enthought 网站,EPD Python 发行版将 MKL 用于 numpy 和 scipy。EPD Free 是否也使用 MKL?如果不是,它是否为 BLAS/LAPACK 使用另一个库?我正在使用 EPD Free 7.3-2
另外,可以在 scipy.org 上找到的用于 numpy 的 Windows 二进制安装程序使用什么库?
multithreading - 使用 mkl 编译 r(支持多线程)
我根据这些指南编译了 R:
http://www.r-bloggers.com/compiling-64-bit-r-2-10-1-with-mkl-in-linux/
http://cran.r-project.org/doc/manuals/R-admin.html#MKL
但是对于矩阵代数,R 并不使用所有可用的 CPU。
我都试过了:
和
选项。
如何强制 R 使用所有可用的 CPU?
如何检查 R 是否使用 MKL?
c - 使用预定的特征值计算 lapack 中的特征向量?
我对 lapack 有一个相当不寻常的挑战,我花了几个小时寻找解决方案。
我有一个传统形式的广义特征值问题(A - x B = 0)。通常我会使用例如 ?hegvx 或 ?hegvd 来计算特征值和特征向量。
但是我现在面临的挑战是,现在我已经从问题的构造中知道了特征值,因此我需要一个有效的lapack 例程来仅计算特征向量?
有人对此有破解吗?