我需要从 Matlab 分析我的 CUDA 代码。我一直在将一些 matlab 代码转换为 CUDA 以提高性能。我通过调用调用 CUDA 的 mexFunction 来做到这一点。matlab feval 函数没有提供足够的控制。我可以通过 VS 运行 mexFunction 来调试它,但我也需要调试内核,因为我相信这就是问题所在。
所以,我的问题是如何在执行调用它的 matlab 函数时通过分析器运行 CUDA 代码?
将所有输入的值硬编码到 CUDA 函数中是不切实际的。
我正在使用 Tesla C2050 GPU 卡在 Windows 7 64 位上运行 Matlab 2012a 64 位