我对同步有点困惑。
- 使用
__syncthreads
你可以在一个块中同步线程。这个,(使用__syncthreads
)必须只与共享内存一起完成?或者使用__syncthreads
具有最佳性能的共享内存? - 通常,只有当且仅当它们存在于同一个线程块中时,线程才能安全地相互通信,对吗?那么,为什么我们不总是使用共享内存呢?因为不够大?而且,如果我们不使用共享内存,我们如何确保结果是正确的?
- 我有一个有时运行正常的程序(我得到结果),有时我得到'nan'结果而不改变任何东西。这可能是同步的问题吗?