我开发了一个简单的函数,用于使用 CUDA C++ 水平或垂直镜像图像。
后来我才知道 NVIDIA Performance Primitives Library 也提供了镜像功能。
只是为了比较,我将我的函数与 NPP 进行了计时。令人惊讶的是,我的功能表现出色(虽然差距很小,但仍然......)。
我通过使用 Windows 计时器和 CUDA 计时器多次确认了结果。
我的问题是:NPP 功能不是针对 NVIDIA GPU 完全优化的吗?
我正在使用 CUDA 5.0、GeForce GTX460M(Compute 2.1)和 Windows 8 进行开发。