我正在开发一个程序,我在其中调用一个输入随机二进制数的函数。总数将在运行时提供,例如:1000 或 10,00,000.. 在生成随机数后,我需要使用 COUNTERS 计算 0 的总数和 1 的总数。我有以下查询:
- 我应该分配多少线程、块和网格?
- 我需要 2D 螺纹,还是只能使用 1D 螺纹?
- 什么函数线程会在里面做什么,我觉得它应该检查特定值是 1 还是 0 这听起来对吗?
- 我应该如何使用经纱或平铺方法?
我正在开发一个程序,我在其中调用一个输入随机二进制数的函数。总数将在运行时提供,例如:1000 或 10,00,000.. 在生成随机数后,我需要使用 COUNTERS 计算 0 的总数和 1 的总数。我有以下查询:
我猜这可能是一个家庭作业问题,尤其是基于您在 SO 上发布的唯一其他问题。
如果您有空的话,CUDA C 编程指南是一个可读性很强的文档,它将向您展示良好的 GPU 编程所需的基本概念。nvidia 网站上也有网络研讨会,可以在大约 2 小时内涵盖此处的重要材料。此外,thrust可以通过最少的编码工作(在 C++ 中)方便地处理此类问题,但我猜这超出了您现在尝试做的范围。