问题标签 [blas]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

838 问题

0 投票

1 回答

411 浏览

scientific-computing - GSL gsl_blas_sgemm 矩阵乘法对于 n>140 非常不准确

只是为了使用 gsl_blas_sgemm 函数单独测试一个乘以 150x150 的所有矩阵。我得到的错误多达 38 个。为什么它这么不准确？

2011-05-08T00:04:56.077

0 投票

2 回答

3159 浏览

fortran - 带有简单 MKL BLAS 例程的 Fortran 双精度程序

在尝试在一个简单的程序中混合精度 - 使用实数和双精度 - 并使用 BLAS 的 ddot 例程，我为双精度部分提出了不正确的输出。这是代码：

我尝试使用 MKL BLAS 库同时编译 gfortran 和 ifort，如下所示：

输出是：

如何让 ddot 例程正确处理双精度值？

此外，添加 -autodouble 标志 (ifort) 或 -fdefault-real-8 (gfortran) 标志会使两个 ddot 例程都工作，但 sdot 例程会失败。

编辑： 我添加了隐式 none 语句，以及 ddot 和 sdot 函数的两个类型语句。如果没有为函数调用指定类型，则 ddot 被隐式键入为单精度实数。

fortran blas double-precision intel-mkl

2011-05-08T05:37:47.543

0 投票

1 回答

495 浏览

c - MKL CBlas 错误

我尝试使用英特尔 MKL 提供的 cblas 将两个矩阵 A 和 B 的乘积转换为 C。是否有任何理由导致错误？

c matrix blas

2011-06-02T09:59:40.470

0 投票

1 回答

3168 浏览

cmake - 使用 CMake 检测 BLAS/LAPACK 供应商

因此，当不同的 BLAS/LAPACK 供应商发生时，我的代码希望包含不同的头文件。是否有任何预定义的宏或类似的东西让我检查它？

cmake lapack blas

2011-06-04T18:47:21.567

0 投票

1 回答

3162 浏览

blas - 无法链接英特尔 MKL

我无法正确链接我的程序。我使用以下命令行，但出现错误。

输出是这样的：

我还尝试运行一个脚本，该脚本尝试将所有 .a 文件逐一链接，但它们都失败了。任何人都可以提出一个解决方案。谢谢。

blas intel-mkl

2011-06-07T20:51:25.103

0 投票

3 回答

816 浏览

c++ - uBLAS 慢矩阵-稀疏向量乘法

我正在转换我自己的一些向量代数代码以使用优化的 boost uBLAS 库。但是，当我尝试进行 SymmetricMatrix-SparseVector 乘法时，我发现它比我自己的实现慢了大约 4 倍。向量大小通常在 0-500 左右，大约 70-80% 的条目为零。

这是我的代码

sparseVectorIndexes 存储输入向量的非零值的索引，vectorLength 是向量的长度，sparseLength 是向量中非零的个数。该矩阵存储为对称矩阵symmetric_matrix<double, lower>。

我自己的实现是一个简单的嵌套循环迭代，其中矩阵只是一个二维双数组：

}

为什么 uBLAS 慢 4 倍？我没有正确写乘法吗？还是有另一个图书馆更适合这个？

编辑：如果我使用密集向量数组，那么 uBLAS 只会慢 2 倍......

c++boost linear-algebra blas ublas

2011-06-13T13:17:37.713

0 投票

1 回答

348 浏览

objective-c - 从 2D NSArray 创建一个 C 数组

我有一个字符串数字的 2D NSArray，我想将其转换为双精度的 2D C 数组，以用于 BLAS/LAPACK 函数（通过加速框架）。这行代码似乎可以工作，但似乎效率极低，最终由于 malloc 错误而崩溃。有没有更有效的方法将此 2D NSArray 转换为 C 数组？还是将 NSArrays 与 BLAS/LAPACK 一起使用的便捷方式？

fileLines 是一个数组，其中包含被解析为相应数字的文件行。

objective-c ios blas acc

2011-06-15T00:05:19.067

0 投票

2 回答

6614 浏览

matlab - 调用 MATLAB 的内置 LAPACK/BLAS 例程

我想学习如何在 MATLAB 中调用内置的 LAPACK/BLAS 例程。我有 MATLAB 和 mex 文件的经验，但我实际上不知道如何调用 LAPACK 或 BLAS 库。我在文件交换中找到了简化调用的网关例程，因为我不必为任何函数（例如这个函数）编写 mex 文件。我需要任何玩具示例来学习 MATLAB 和这些内置库之间的基本消息传递。欢迎任何玩具示例，例如矩阵乘法或 LU 分解。

matlab linear-algebra lapack blas

2011-06-22T10:44:02.143

0 投票

1 回答

1239 浏览

linear-algebra - dtrtrs 和 dtrsm 的区别

我正在寻找一些三角求解器，我遇到了两个求解器。BLAS 中的一个：dtrsm 和 LAPACK 中的另一个：dtrtrs。从外观上看，两者似乎都具有共同的功能，而 dtrsm 具有更多功能（在解决系统之前缩放右侧）。

我想知道
1）这些功能还有什么不同？
2）当执行相同的操作时，哪个更快？
3) 如果 (2) 的答案不明显，什么时候建议 dtrsm 优于 dtrtrs，反之亦然？

linear-algebra lapack blas

2011-06-29T00:02:27.140

0 投票

2 回答

1023 浏览

c - 与 BLAS 的 catlas_saxpby 的向量乘法无法正常工作

我试图有两个任意长度的向量（典型长度为 2048）并逐个元素相乘。所以 Z[n] = X[n] * Y[n] 对于所有 n。

我设置要测试的代码是相当基本的：

结果进入inputY，结果是

如果他们相乘，它应该是 4、16、64、256。但它看起来像是在相加。

所以这没有达到我的预期，并且文档没有给我足够的信息来弄清楚它在做什么。

有任何想法吗？

c ios blas

2011-07-05T04:11:34.960

1 2 3 4 5 6 7 8 9 10

问题标签 [blas]

Reference