我正在研究 PTX,但我不明白 CTA(计算线程数组)与 CUDA 块有何不同。
它们是一样的吗?在我看来,现在(我只是在 PTX 文档的开头)它们是一样的
是的,PTX 协作线程数组在概念上和功能上与 CUDA 中的块或 OpenCL 中的工作组相同。
CUDA PTX ISA 文档的线程层次结构部分解释说,本质上,CTA 表示 CUDA 块。
另请注意,它实际上不是“计算线程数组”,而是“协作线程数组”(!)。
CTA 只是 Threadblock Nvidia 将其称为 CTA 的另一种说法。