问题标签 [opencl.net]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
.net - openTK 与 openCL.NET
我开始在 .NET 上使用 openCL。openTK 与 openCL.NET 相比如何——哪个更好?
c# - OpenCL 和 GPU 编程路线图
我想开始说明我对 OpenCL/GPU 编程一无所知,但我是一名高级 C#(通用 .Net)程序员,不惧怕 C++,我想学习 OpenCL/GPU 编程……我的问题是……我从哪里开始?!?我应该下载什么?!?有没有办法在 Visual Studio(在 C# 上)上对 OpenCL/GPU 进行编程!?!像...你好世界的东西... tks all
c# - 完整的 .NET OpenCL 实现
我一直在寻找,但运气不佳。OpenCL是否有任何有据可查的 .NET 绑定实现?(如果必须的话,我会为 CUDA 买点东西)。我遇到过各种实现,CUDA.NET、OpenCL.NET、OpenTK / Cloo(我知道,它们经常在 stackoverflow 中被提及),但它们似乎都处于 alpha 阶段,或者完全没有可用的示例。CUDA.NET 有一些帮助文件,但它只是一个库参考,并不能真正帮助您入门。
我希望找到的是一个成熟的.NET GPU 编程库。最终我需要能够用 F# 编写代码,但我会采用任何兼容 .NET 的语言,因为我总是可以稍后转换它并使用包含的任何示例来启动和运行。
自从我到处搜索以来,这可能是一个很长的机会,但我希望这只是我不知道要搜索的正确内容的情况之一。
任何帮助将不胜感激。
.net - .Net 中的 GPGPU 编程 - Microsoft Accelerator VS OpenCL.net [VS Others]
我正在开发一个程序(在 .Net 中),它有很多图像处理(如 2D 卷积,...),我想用 GPGPU(并行处理)来完成它们所以,我有一些选择:Microsoft Accelerator、OpenCL。网,...哪一个更适合我?
对我来说重要的一些事情:速度、兼容性(例如,如果 GPU 不支持,会发生什么?)、易于学习、与 Nvidia 和 ATI 一起工作,...
而且我听说我可以在 OpenCL 中创建自己的函数并为许多数组单元运行它,但我不知道我是否可以在 Microsoft Accelerator 中做到这一点,或者我必须使用它的函数......
opencl - clGetDeviceIDs 在 OpenCL 中失败,错误代码为 -30
以下程序在我的机器上使用 ATI Firepro V8750 的输出如下:
(这发生在调用第一个 clGetDeviceIDs 时)。返回的错误代码是-30。这意味着什么?
我无法理解为什么它无法找到该设备。我检查了 CLinfo.exe 列出了我的 GPU 以及我拥有的 Intel CPU。有人可以给我一些关于这里有什么问题的指示吗?
附加信息:
AMD 应用程序 SK 2.4
Firepro 驱动程序:8.911.3.3_VistaWin7_X32X64_135673
12-4_vista_win7_32_dd_ccc
Windows 7 另外我必须提到 firePro 驱动程序的一些组件无法安装。
这是 CLINFO 输出:GPU:
中央处理器:
为什么两个突出显示的版本不同?
c# - 在 OpenCL 中使用本地工作人员进行大型矩阵计算
我是在 Visual Studio C# 中使用 OpenCL(带有 OpenCL.NET 库)的新手,目前正在开发一个计算大型 3D 矩阵的应用程序。在矩阵中的每个像素处,计算 192 个唯一值,然后求和以产生该像素的最终值。因此,从功能上讲,它就像一个 4-D 矩阵,(161 x 161 x 161) x 192。
现在我正在从我的主机代码中调用内核,如下所示:
示例内核代码发布在下面。
我的代码目前可以工作,但是我正在寻找此应用程序的速度,我不确定我的工作人员/组设置是否是最佳方法(即工作人员池的尺寸为 161*161*161 和 192)。
我已经看到了将全局工作池组织到本地工作组以提高效率的其他示例,但我不太确定如何在 OpenCL.NET 中实现它。我也不确定这与在工作池中创建另一个维度有何不同。
所以,我的问题是:我可以在这里使用本地组吗?如果可以,我将如何组织它们?一般来说,使用本地组与仅调用 n 维工作池有何不同?(即调用 Execute(args, new int[]{(N*N*N),192}),而不是本地工作组大小为 192?)
感谢所有的帮助!
cuda - OpenCl 相当于在 CUDA 中查找连续索引
在 CUDA 中,为了覆盖多个块,从而增加数组的索引范围,我们执行以下操作:
主机端代码:
设备端代码
OpenCL 中实现上述情况的等价物是什么?
cuda - OpenCL 版本的 cudaMemcpyToSymbol & 优化
有人可以告诉我用于将 __constant 复制到设备并返回主机的 OpenCl 版本的 cudaMemcpyToSymbol 吗?
还是通常的 clenquewritebuffer(...) 可以完成这项工作?
在论坛中找不到太多帮助。实际上几行演示就足够了。
我也应该期望在 opencl 中进行与使用常量缓存的 CUDA 相同的优化吗?
谢谢
opencl - OpenCL 成像 - 仅更新一个像素
我正在使用 Opencl.net,我正在尝试在 GPU 上进行一些图像处理。不幸的是,只有第一个像素 ([0;0]) 具有正确的值,其余的是 (0;0;0;0)。OpenCL 内核应该为每个像素的所有颜色分量分配 0.5。在我看来,内核只执行一次(或者读取函数可能只读取第一个像素)。我究竟做错了什么?我从我的代码中省略了不相关的部分:
谢谢!
opencl - 使用 OpenCL.NET 进行图像处理
我正在尝试使用 .NET 在 GPU 上进行图像处理。我已经下载了 OpenCL.NET wrapper。它有一些很好的样本,但我找不到将图像加载到 GPU 并读回处理后的图像的方法。我需要做什么?