问题标签 [blas]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
411 浏览

scientific-computing - GSL gsl_blas_sgemm 矩阵乘法对于 n>140 非常不准确

只是为了使用 gsl_blas_sgemm 函数单独测试一个乘以 150x150 的所有矩阵。我得到的错误多达 38 个。为什么它这么不准确?

0 投票
2 回答
3159 浏览

fortran - 带有简单 MKL BLAS 例程的 Fortran 双精度程序

在尝试在一个简单的程序中混合精度 - 使用实数和双精度 - 并使用 BLAS 的 ddot 例程,我为双精度部分提出了不正确的输出。这是代码:

我尝试使用 MKL BLAS 库同时编译 gfortran 和 ifort,如下所示:

输出是:

如何让 ddot 例程正确处理双精度值?

此外,添加 -autodouble 标志 (ifort) 或 -fdefault-real-8 (gfortran) 标志会使两个 ddot 例程都工作,但 sdot 例程会失败。

编辑: 我添加了隐式 none 语句,以及 ddot 和 sdot 函数的两个类型语句。如果没有为函数调用指定类型,则 ddot 被隐式键入为单精度实数。

0 投票
1 回答
495 浏览

c - MKL CBlas 错误

我尝试使用英特尔 MKL 提供的 cblas 将两个矩阵 A 和 B 的乘积转换为 C。是否有任何理由导致错误?

0 投票
1 回答
3168 浏览

cmake - 使用 CMake 检测 BLAS/LAPACK 供应商

因此,当不同的 BLAS/LAPACK 供应商发生时,我的代码希望包含不同的头文件。是否有任何预定义的宏或类似的东西让我检查它?

0 投票
1 回答
3162 浏览

blas - 无法链接英特尔 MKL

我无法正确链接我的程序。我使用以下命令行,但出现错误。

输出是这样的:

我还尝试运行一个脚本,该脚本尝试将所有 .a 文件逐一链接,但它们都失败了。任何人都可以提出一个解决方案。谢谢。

0 投票
3 回答
816 浏览

c++ - uBLAS 慢矩阵-稀疏向量乘法

我正在转换我自己的一些向量代数代码以使用优化的 boost uBLAS 库。但是,当我尝试进行 SymmetricMatrix-SparseVector 乘法时,我发现它比我自己的实现慢了大约 4 倍。向量大小通常在 0-500 左右,大约 70-80% 的条目为零。

这是我的代码

sparseVectorIndexes 存储输入向量的非零值的索引,vectorLength 是向量的长度,sparseLength 是向量中非零的个数。该矩阵存储为对称矩阵symmetric_matrix<double, lower>

我自己的实现是一个简单的嵌套循环迭代,其中矩阵只是一个二维双数组:

}

为什么 uBLAS 慢 4 倍?我没有正确写乘法吗?还是有另一个图书馆更适合这个?

编辑:如果我使用密集向量数组,那么 uBLAS 只会慢 2 倍......

0 投票
1 回答
348 浏览

objective-c - 从 2D NSArray 创建一个 C 数组

我有一个字符串数字的 2D NSArray,我想将其转换为双精度的 2D C 数组,以用于 BLAS/LAPACK 函数(通过加速框架)。这行代码似乎可以工作,但似乎效率极低,最终由于 malloc 错误而崩溃。有没有更有效的方法将此 2D NSArray 转换为 C 数组?还是将 NSArrays 与 BLAS/LAPACK 一起使用的便捷方式?

fileLines 是一个数组,其中包含被解析为相应数字的文件行。

0 投票
2 回答
6614 浏览

matlab - 调用 MATLAB 的内置 LAPACK/BLAS 例程

我想学习如何在 MATLAB 中调用内置的 LAPACK/BLAS 例程。我有 MATLAB 和 mex 文件的经验,但我实际上不知道如何调用 LAPACK 或 BLAS 库。我在文件交换中找到了简化调用的网关例程,因为我不必为任何函数(例如这个函数)编写 mex 文件。我需要任何玩具示例来学习 MATLAB 和这些内置库之间的基本消息传递。欢迎任何玩具示例,例如矩阵乘法或 LU 分解。

0 投票
1 回答
1239 浏览

linear-algebra - dtrtrs 和 dtrsm 的区别

我正在寻找一些三角求解器,我遇到了两个求解器。BLAS 中的一个:dtrsm 和 LAPACK 中的另一个:dtrtrs。从外观上看,两者似乎都具有共同的功能,而 dtrsm 具有更多功能(在解决系统之前缩放右侧)。

我想知道
1)这些功能还有什么不同?
2)当执行相同的操作时,哪个更快?
3) 如果 (2) 的答案不明显,什么时候建议 dtrsm 优于 dtrtrs,反之亦然?

0 投票
2 回答
1023 浏览

c - 与 BLAS 的 catlas_saxpby 的向量乘法无法正常工作

我试图有两个任意长度的向量(典型长度为 2048)并逐个元素相乘。所以 Z[n] = X[n] * Y[n] 对于所有 n。

我设置要测试的代码是相当基本的:

结果进入inputY,结果是

如果他们相乘,它应该是 4、16、64、256。但它看起来像是在相加。

所以这没有达到我的预期,并且文档没有给我足够的信息来弄清楚它在做什么。

有任何想法吗?