在nvidia的cuda技术中。
有两个概念:cuda编程中stream的概念,和Stream Multiprocessors的概念(Maxwell Architecture中也称为SMM,有时简称为SM),如何理解这两者?
案例一:我只是使用默认流来执行内核,并且块数足够大。在这种情况下,我的所有 5 个流多处理器(GTX 750 Ti 有 5 个 SMM,即 640 核)是否都参与处理块,或者只有一个流多处理器参与处理一个默认流
案例二:我使用 cudaStreamCreate() 创建 5 个(或更多)流,并使用它们执行 5 个不同的内核,其中所有 5 个内核都是独立的,这 5 个内核会在物理上并行处理吗?