问题标签 [cudpp]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
5 回答
8164 浏览

sorting - 使用 Thrust CUDA 对对象进行排序

是否可以使用 Thrust 库对对象进行排序?我有以下结构:

是否可以使用推力来根据 N 对 OB 数组进行排序?您能否提供一个使用推力对对象进行排序的简单示例?如果推力不能这样做,是否有任何其他 CUDA 库允许我这样做?

0 投票
1 回答
206 浏览

cuda - 当输入数据大小大于 700,000 时,cudppscan 给出错误输出

CUDA cudppScan用来计算元素数组的前缀和。当输入数据量较小时效果很好。但是当数据大小大于约 700,000 时,输出的某些元素会变成错误值。

我正在做cudppScan一个数组,所以输出应该是1, 2, 3, 4, ....

这是我的代码:

所以请帮忙指出我哪里做错了。提前致谢。

0 投票
1 回答
472 浏览

cuda - CUDPP faster than THRUST in sorting? so what about structure arrays?

I have an array of structures and I want to sort them. I have been using Thrust::sort and it works well. Then people tell me CUDPP is faster in sorting but I found it's not possible to sort structure arrays straight forward.

Here they have explained how to sort structure arrays with CUDPP but it sounds resource consuming.

Do you have any suggestion on faster doing the sort? Any other way you do this job?

P.S. my structure is simply some numbers...

0 投票
1 回答
2448 浏览

algorithm - CUDA Stream compaction:理解概念

我正在使用 CUDA/推力/CUDPP。据我了解,在流压缩中,数组中的某些项目被标记为无效,然后被“删除”。

现在“删除”在这里的真正含义是什么?假设原始数组A的长度为 6。如果 2 个元素无效(无论我们提供什么条件),那么

  1. 系统是否在 GPU 内存中创建一个大小为 4 的数组来存储有效元素以获得最终结果?

  2. 或者它是否从内存中物理删除无效元素并将原始数组 A 缩小到 4 大小,只保留有效元素?

无论哪种情况,这是否意味着动态内存分配正在幕后发生?但我听说动态内存分配在 CUDA 世界中是不可能的。

0 投票
1 回答
1123 浏览

cuda - 推力/cudpp中的算法找到第k个最小元素

我正在寻找推力/cudapp 中第 k 个最小元素算法的实现。我用谷歌搜索了它,但似乎没有找到它。有谁知道是否存在这样的算法?

我看到有重新排序,但它没有说第 k 个最小。

0 投票
1 回答
168 浏览

cuda - cudpp 是否仅适用于具有一定计算能力的设备

我想使用cudpp。我很好奇它是否仅适用于具有某种计算能力的设备?如果是,下限是多少。

我在他们的哈希表实现代码中发现了这条错误消息:“testHashTable 中的 cudppHashTable 调用出错(确保您的设备至少是计算版本 2.0\n”

我不知道他们指的是哪个计算版本?

0 投票
1 回答
472 浏览

cuda - OpenMPI CUDA 和 CUDPP

我有 mpi 程序在集群上的几个进程之间分配大数组。

每个进程计算自己的数组元素总和并将结果返回给主机。

我想对每个进程的数组元素运行并行前缀扫描。

任何想法是否可以使用 CUDPP。?

有没有人一起使用过openmpi和cudpp?

0 投票
1 回答
988 浏览

cuda - 推力与 CUDPP

为了在带有 CUDA 的 GPU 上使用数据并行算法,有两个标准库,CUDPP 和 Thrust,它们实现了排序、归约、前缀和等。

那么库之间在性能和功能方面的主要区别是什么?

0 投票
1 回答
1655 浏览

sorting - 使用 CUDPP/Thrust 进行分段排序

是否可以在 CUDA 中使用 CUDPP 进行分段排序?通过分段排序,我的意思是对受以下标志保护的数组元素进行排序。

对 A 中连续 1 之间的元素进行排序。
预期输出

0 投票
1 回答
188 浏览

cuda - 如何在没有cmake的情况下使用cudpp?

我需要使用 cudpp 的扫描功能。但是,cudpp 需要 cmake 才能编译。有没有办法直接将cudpp的扫描功能用于CUDA的C代码?如果是这样,我该怎么做?