例如,CUBLAS 包含接受设备或主机指针作为参数的函数(例如 cublas<t>gemm() 的 alpha 和 beta 参数,参见 [1])。如何编写具有这种功能的函数?有什么限制?诸如具有统一地址空间的设备之类的极端情况呢?
以正确方式执行此操作的示例源代码将非常棒。
例如,CUBLAS 包含接受设备或主机指针作为参数的函数(例如 cublas<t>gemm() 的 alpha 和 beta 参数,参见 [1])。如何编写具有这种功能的函数?有什么限制?诸如具有统一地址空间的设备之类的极端情况呢?
以正确方式执行此操作的示例源代码将非常棒。
CUBLAS 中没有魔术指针自省。该库使用显式的每个上下文切换来控制指针的解释方式(请参阅 参考资料cudaSetPointerMode
)。