0

嘿,我目前正在 matlab 中开发一个 Mex 文件,包括 CUDA 计算。我想知道是否有一种“自动”优化来自用户的任意输入参数的程序的好方法。例如,当输入参数不超过某个大小时,请尝试使用共享和/或常量内存......这只能在某些限制下工作。从那里开始,必须使用全局内存。但是这种优化只能在运行时进行,因为这是我从用户那里了解输入参数大小的关键。有什么简单的解决办法吗?谢谢!

4

1 回答 1

2

您可以简单地编写不同的内核并决定在运行时调用哪些内核。

您还可以使用设备查询 API 或做一些微基准测试来确定运行时共享/恒定内存的大小。如果您不想假设特定的 GPU 模型,这可能是必要的。

于 2011-05-12T17:06:35.603 回答