我正在尝试分析使用 3D 表面读取和写入 3D cudaArrays 的内核。
不幸的是,nvprof 完全没有显示任何纹理读取或写入或缓存活动等。
它还显示出非常糟糕的内存访问等。
该应用程序运行良好,因此表面读取和写入调用显然可以正常工作。
对此有什么想法吗?也许 nvprof 还不能显示表面活性?
我正在尝试分析使用 3D 表面读取和写入 3D cudaArrays 的内核。
不幸的是,nvprof 完全没有显示任何纹理读取或写入或缓存活动等。
它还显示出非常糟糕的内存访问等。
该应用程序运行良好,因此表面读取和写入调用显然可以正常工作。
对此有什么想法吗?也许 nvprof 还不能显示表面活性?