我正在使用最新版本的 CUDA 5.5,而新的 CUBLAS 有一个有状态的品味,其中每个功能都需要一个cublasHandle_t
例如
cublasHandle_t handle;
cublasCreate_v2(&handle);
cublasDgemm_v2(handle, A_trans, B_trans, m, n, k, &alpha, d_A, lda, d_B, ldb, &beta, d_C, ldc);
cublasDestroy_v2(handle);
像某种 a 一样尽可能多地重用这个句柄实例是一种好习惯吗,Session
或者性能影响会很小,以至于通过拥有短暂的句柄实例来降低代码复杂性更有意义,因此可以连续创建/销毁它?