在 CUDA 6.5 的文档中写道:http ://docs.nvidia.com/cuda/cuda-c-programming-guide/index.html#ixzz3PIXMTktb
5.2.3。多处理器级别
...
- 8L 用于计算能力 3.x 的设备,因为如计算能力 3.x 中所述,多处理器在一个时钟周期内为每个扭曲发出一对指令,一次四个扭曲。
这是否意味着 GPU Kepler CC3.0 处理器不仅是流水线架构,而且是超标量?
流水线 - 这两个序列并行执行(一次不同的操作):
- 加载 [addr1] -> 添加 -> 存储 [addr1] -> NOP
- NOP -> 加载 [addr2] -> 添加 -> 存储 [addr2]
超标量 - 这两个序列并行执行(一次相同的操作):
- 加载 [reg1] -> 添加 -> 存储 [reg1]
- 加载 [reg2] -> 添加 -> 存储 [reg2]