根据Kepler 架构白皮书,SMX 具有192
CUDA 内核和64
双精度单元 (DPU)。对于 K20Xm,14
SMX 的内核总数2688
,这意味着只计算 CUDA 内核。那么 DPU 的用途到底是什么,它们的用途与内核有什么关系?
我的想法:
a) CUDA 核心不能进行双精度运算,只有 DPU 可以。因此,当 DPU 忙时,CUDA 内核可用于其他工作。
b) CUDA 内核不知何故需要一个双精度单元来执行双精度操作,因此只有128
CUDA192
内核可用于其他东西。
干杯安迪