我构建了一个神经网络,它需要使用 Cholesky 分解和求解三角系统作为其计算的一部分。当然,这意味着我还需要计算整个计算的梯度。
当我尝试编译代码时,我收到错误“没有可用的 Cula”。不幸的是,我无法从网站下载 Cula 。
我想知道是否可以将 CPU 和 GPU 与 theano 混合使用。我需要使用 Cholesky 和 Solve 的矩阵很小 (100x100),所以我可以在 CPU 上完成这部分。不过,要做到这一点,我需要在 GPU 计算完矩阵后立即将它们传输到 CPU,然后将结果发送回 GPU。是否有可能足够透明地做到这一点?