9

我开发了一个简单的函数,用于使用 CUDA C++ 水平或垂直镜像图像。

后来我才知道 NVIDIA Performance Primitives Library 也提供了镜像功能。

只是为了比较,我将我的函数与 NPP 进行了计时。令人惊讶的是,我的功能表现出色(虽然差距很小,但仍然......)。

我通过使用 Windows 计时器和 CUDA 计时器多次确认了结果。

我的问题是:NPP 功能不是针对 NVIDIA GPU 完全优化的吗?

我正在使用 CUDA 5.0、GeForce GTX460M(Compute 2.1)和 Windows 8 进行开发。

4

1 回答 1

11

通过发布此答案,我冒着得不到选票的风险。:)

NVIDIA 不断努力改进我们所有的 CUDA 库。NPP 是一个特别大的库,需要维护 4000 多个函数。我们有一个现实的目标,即为库提供比 CPU 等效的有用加速,在我们所有的 GPU 和支持的操作系统上进行测试,并积极改进和维护。有问题的功能(镜像)是一个已知的性能问题,我们将在未来的版本中改进。如果您需要优化特定功能,获得优先级的最佳方法是使用NVIDIA CUDA 注册开发人员可用的错误提交表单提交 RFE 错误(增强请求)。

顺便说一句,我不认为任何库都可以“完全优化”。有了一个庞大的库来支持庞大且不断增长的硬件基础,优化它的工作永远不会完成!:)

我们鼓励人们继续尝试并超越 NVIDIA 库,因为总体而言,它推进了最先进的技术并有利于计算生态系统。

于 2012-09-17T22:40:09.110 回答