我刚刚了解到(从Why only a warp is executed by a SM in cuda?)中,Kepler GPU 实际上可以一次执行来自多个(显然是 4 个)warp 的指令。
共享内存库也可以同时服务四个请求吗?如果不是,那意味着银行冲突可能发生在碰巧同时执行的不同warp的线程之间,即使在任何单独的warp中都没有银行冲突,对吧?有这方面的信息吗?
我刚刚了解到(从Why only a warp is executed by a SM in cuda?)中,Kepler GPU 实际上可以一次执行来自多个(显然是 4 个)warp 的指令。
共享内存库也可以同时服务四个请求吗?如果不是,那意味着银行冲突可能发生在碰巧同时执行的不同warp的线程之间,即使在任何单独的warp中都没有银行冲突,对吧?有这方面的信息吗?