嘿,我目前正在 matlab 中开发一个 Mex 文件,包括 CUDA 计算。我想知道是否有一种“自动”优化来自用户的任意输入参数的程序的好方法。例如,当输入参数不超过某个大小时,请尝试使用共享和/或常量内存......这只能在某些限制下工作。从那里开始,必须使用全局内存。但是这种优化只能在运行时进行,因为这是我从用户那里了解输入参数大小的关键。有什么简单的解决办法吗?谢谢!
问问题
313 次
嘿,我目前正在 matlab 中开发一个 Mex 文件,包括 CUDA 计算。我想知道是否有一种“自动”优化来自用户的任意输入参数的程序的好方法。例如,当输入参数不超过某个大小时,请尝试使用共享和/或常量内存......这只能在某些限制下工作。从那里开始,必须使用全局内存。但是这种优化只能在运行时进行,因为这是我从用户那里了解输入参数大小的关键。有什么简单的解决办法吗?谢谢!