1

这个问题是解释 ptxas 的详细输出的延续,第一部分

当我们用 编译一个内核.ptx文件ptxas -v,或者用 用一个.cu文件编译它时-ptxas-options=-v,我们会得到几行输出,例如:

ptxas info    : Compiling entry function 'searchkernel(octree, int*, double, int, double*, double*, double*)' for 'sm_20'
ptxas info    : Function properties for searchkernel(octree, int*, double, int, double*, double*, double*)
    72 bytes stack frame, 0 bytes spill stores, 0 bytes spill loads
ptxas info    : Used 46 registers, 176 bytes cmem[0], 16 bytes cmem[14]

(与链接到的问题中的示例相同;但名称拆解)

这个问题是关于最后一行的。来自其他内核的更多示例:

ptxas info    : Used 19 registers, 336 bytes cmem[0], 4 bytes cmem[2]
...
ptxas info    : Used 19 registers, 336 bytes cmem[0]
... 
ptxas info    : Used 6 registers, 16 bytes smem, 328 bytes cmem[0]

除了使用的寄存器数量之外,我们如何解释这一行的信息?具体来说:

  • cmem常量记忆的缩写吗?
  • 为什么有不同的类别,cmemcmem[0],,?cmem[2]cmem[14]
  • smem可能代表shared memory; 它只是静态共享内存吗?
  • 每种条目在什么情况下会出现在这一行?
4

2 回答 2

3

cmem 是常量内存的缩写吗?

是的

为什么cmem有不同的类别,即cmem[0]、cmem[2]、cmem[14]?

它们代表不同的常量存储库。cmem[0]是内核参数和静态大小的常量值的保留库。

smem 可能代表共享内存;它只是静态共享内存吗?

是的,否则怎么可能。

每种条目在什么情况下会出现在这一行?

主要是在这里回答。

于 2019-05-16T21:00:50.930 回答
0

收集并重新格式化...

最后一个 ptxas 信息行的资源:

  • registers- 在每个 SM(多处理器)的寄存器文件中
  • gmem- 全局内存
  • smem- 静态共享内存
  • cmem[N]- 具有索引 N 的常量存储库。
    • cmem[0]- 为内核参数和静态大小的常量值保留的库
    • cmem[2]- ???
    • cmem[4]- ???
    • cmem[14]- ???

如果内核使用任何此类内存(寄存器 - 可能总是显示),则将显示这些类别中的每一个;cmem[0]因此,所有示例都显示了一些用法也就不足为奇了。

您可以在编程指南的第 2.3 节和那里的链接中阅读更多关于 CUDA 内存层次结构的信息。此外,还有这篇关于静态与动态共享内存的博文。

于 2019-05-16T21:21:58.347 回答