问题标签 [blas]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
scientific-computing - GSL gsl_blas_sgemm 矩阵乘法对于 n>140 非常不准确
只是为了使用 gsl_blas_sgemm 函数单独测试一个乘以 150x150 的所有矩阵。我得到的错误多达 38 个。为什么它这么不准确?
fortran - 带有简单 MKL BLAS 例程的 Fortran 双精度程序
在尝试在一个简单的程序中混合精度 - 使用实数和双精度 - 并使用 BLAS 的 ddot 例程,我为双精度部分提出了不正确的输出。这是代码:
我尝试使用 MKL BLAS 库同时编译 gfortran 和 ifort,如下所示:
输出是:
如何让 ddot 例程正确处理双精度值?
此外,添加 -autodouble 标志 (ifort) 或 -fdefault-real-8 (gfortran) 标志会使两个 ddot 例程都工作,但 sdot 例程会失败。
编辑: 我添加了隐式 none 语句,以及 ddot 和 sdot 函数的两个类型语句。如果没有为函数调用指定类型,则 ddot 被隐式键入为单精度实数。
c - MKL CBlas 错误
我尝试使用英特尔 MKL 提供的 cblas 将两个矩阵 A 和 B 的乘积转换为 C。是否有任何理由导致错误?
cmake - 使用 CMake 检测 BLAS/LAPACK 供应商
因此,当不同的 BLAS/LAPACK 供应商发生时,我的代码希望包含不同的头文件。是否有任何预定义的宏或类似的东西让我检查它?
blas - 无法链接英特尔 MKL
我无法正确链接我的程序。我使用以下命令行,但出现错误。
输出是这样的:
我还尝试运行一个脚本,该脚本尝试将所有 .a 文件逐一链接,但它们都失败了。任何人都可以提出一个解决方案。谢谢。
c++ - uBLAS 慢矩阵-稀疏向量乘法
我正在转换我自己的一些向量代数代码以使用优化的 boost uBLAS 库。但是,当我尝试进行 SymmetricMatrix-SparseVector 乘法时,我发现它比我自己的实现慢了大约 4 倍。向量大小通常在 0-500 左右,大约 70-80% 的条目为零。
这是我的代码
sparseVectorIndexes 存储输入向量的非零值的索引,vectorLength 是向量的长度,sparseLength 是向量中非零的个数。该矩阵存储为对称矩阵symmetric_matrix<double, lower>
。
我自己的实现是一个简单的嵌套循环迭代,其中矩阵只是一个二维双数组:
}
为什么 uBLAS 慢 4 倍?我没有正确写乘法吗?还是有另一个图书馆更适合这个?
编辑:如果我使用密集向量数组,那么 uBLAS 只会慢 2 倍......
objective-c - 从 2D NSArray 创建一个 C 数组
我有一个字符串数字的 2D NSArray,我想将其转换为双精度的 2D C 数组,以用于 BLAS/LAPACK 函数(通过加速框架)。这行代码似乎可以工作,但似乎效率极低,最终由于 malloc 错误而崩溃。有没有更有效的方法将此 2D NSArray 转换为 C 数组?还是将 NSArrays 与 BLAS/LAPACK 一起使用的便捷方式?
fileLines 是一个数组,其中包含被解析为相应数字的文件行。
c - 与 BLAS 的 catlas_saxpby 的向量乘法无法正常工作
我试图有两个任意长度的向量(典型长度为 2048)并逐个元素相乘。所以 Z[n] = X[n] * Y[n] 对于所有 n。
我设置要测试的代码是相当基本的:
结果进入inputY,结果是
如果他们相乘,它应该是 4、16、64、256。但它看起来像是在相加。
所以这没有达到我的预期,并且文档没有给我足够的信息来弄清楚它在做什么。
有任何想法吗?