继续我之前的问题。CUDA 适合实时快速应用吗?任务是:我需要我的应用程序在 0.1-0.3 毫秒内进行大量计算。CUDA 内核在适合我的项目的非常好的时间内处理这些计算,但是由于我得到的所有开销(内存复制),时间是不可接受的。
CUDA 是不能用于这种应用程序,还是有一些技巧可以避免我之前的问题中描述的 sutuations?
这些家伙提供了所谓的“GPU Workbench”,并在他们自己的 linux 版本上构建了经过修改的 gpu 驱动程序。他们说他们的系统比典型的 GPU 配置执行得更快。有人知道他们吗?