2

例如,CUBLAS 包含接受设备或主机指针作为参数的函数(例如 cublas<t>gemm() 的 alpha 和 beta 参数,参见 [1])。如何编写具有这种功能的函数?有什么限制?诸如具有统一地址空间的设备之类的极端情况呢?

以正确方式执行此操作的示例源代码将非常棒。

[1] http://docs.nvidia.com/cuda/cublas/index.html#topic_8_1

4

1 回答 1

3

CUBLAS 中没有魔术指针自省。该库使用显式的每个上下文切换来控制指针的解释方式(请参阅 参考资料cudaSetPointerMode)。

于 2013-05-25T13:35:22.613 回答