问题标签 [ispc]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c++ - 如何在 Linux 中编译 ISPC 代码并将其与普通 cpp 文件链接?
我想编译一个ispc程序。我正在尝试为他们的示例程序之一生成可执行文件。
我有以下内容的 simple.cpp
我有以下内容的 simple.ispc
我可以使用 cmake https://github.com/ispc/ispc/tree/main/examples/cpu/simple来获取可执行文件,但我想知道运行 simple.cpp 文件需要执行的原始命令。有人能告诉我如何用 ispc 编译和运行 simple.cpp 文件吗?
c++ - 带有 ispc 编译器的 SPMM 内核产生错误的错误结果
我正在尝试编写一个内核来执行稀疏矩阵密集矩阵乘法,但是用 ispc 编写的内核没有输出正确的结果矩阵。
下面是我在没有 ispc 编译器支持的情况下正常串行执行的内核。
上面的串行内核工作正常并输出所需的输出。我更改了如下代码以支持 ispc。
ispc 内核不会产生正确的结果,我有点卡在这一点上。ispc 不允许我们在内核中也有打印语句。任何帮助纠正错误或调试错误表示赞赏。
arrays - 大型阵列的 ISPC spmm 操作
我在 ispc 中编写了以下内核来执行稀疏矩阵密集矩阵乘法(SpMM)
这里的稀疏矩阵使用 CSR(压缩稀疏行)格式。稀疏矩阵在其密集格式中具有维度 (num_rows, num_rows)。Ap 是 num_rows+1 长度的一维数组,而 Aj 和 Ax 是 num_rows * num_rows * 0.1 的一维数组,因为我正在创建稀疏度为 10% 的稀疏矩阵
内核似乎适用于 num_rows 等于 70000 及以下的值,但是当我尝试使 num_rows 等于 75000 或更高时,代码给出了分段错误错误。由于我使用 int64 作为数组索引,我不确定我在这里做错了什么。任何解决此问题的帮助表示赞赏。