使用驱动程序 api 会阻止在同一应用程序中使用运行时 api ([1])。不幸的是,cublas、cufft 等都是基于运行时 api。如果想要同时在 cuModuleLoad 和 cublas 中定义动态内核,有哪些选择?我有这些,但也许还有更多:
A. 等待传闻支持驱动程序和运行时 API 在同一应用程序中和平共存的计算能力 3.5。
B. 将内核编译为 .so 文件并 dlopen。他们会在 dlcose 上卸载吗?
C. 尝试使用驱动程序 api 中的 cuModuleLoad,但其他一切都来自运行时 api。不知道这是否有任何希望。
我没有屏住呼吸,因为 jcuda 或 pycuda 几乎处于相同的状态,他们可能已经知道了。