我使用基准(Parboil,Rodinia)对 GTX760(Kepler)和 GTX750Ti(Maxwell)进行了实验。然后我使用 Nvidia 视觉分析器分析了结果。在大多数应用中,全局指令的数量在 Maxwell 架构上大幅增加了 7-10 倍。
规格。对于两个显卡
GTX760 6.0Gbps 2048MB 256bit 192.2 GB/s
GTX750Ti 5.4Gbps 2048MB 128bit 86.4Gb/s
Ubuntu 14.04
CUDA 驱动程序 340.29
工具包 6.5
我编译了基准应用程序(没有修改),然后我从 NVVP(6.5)收集了结果。分析所有 > 内核内存 > 从 L1/共享内存部分,我收集了全局负载事务计数。
我附上了我们在开普勒(链接)和麦克斯韦(链接)上运行的histo模拟结果的屏幕截图
有人知道为什么 Maxwell 架构上的全局指令数会增加吗?
谢谢你。