我正在使用 Apple 的 Accelerate Framework,即 vDSP,以执行几个后续的矩阵和向量运算。
CPU 何时从 GPU 收集/复制内存?
每次 vDSP 函数调用后都会发生这种情况吗?
如果没有,有没有办法明确地“强制”收集操作?
我正在使用 Apple 的 Accelerate Framework,即 vDSP,以执行几个后续的矩阵和向量运算。
CPU 何时从 GPU 收集/复制内存?
每次 vDSP 函数调用后都会发生这种情况吗?
如果没有,有没有办法明确地“强制”收集操作?