0

我构建了一个神经网络,它需要使用 Cholesky 分解和求解三角系统作为其计算的一部分。当然,这意味着我还需要计算整个计算的梯度。

当我尝试编译代码时,我收到错误“没有可用的 Cula”。不幸的是,我无法从网站下载 Cula 。

我想知道是否可以将 CPU 和 GPU 与 theano 混合使用。我需要使用 Cholesky 和 ​​Solve 的矩阵很小 (100x100),所以我可以在 CPU 上完成这部分。不过,要做到这一点,我需要在 GPU 计算完矩阵后立即将它们传输到 CPU,然后将结果发送回 GPU。是否有可能足够透明地做到这一点?

4

1 回答 1

1

这种转移是透明的。不需要做一些特别的事情。但我建议您对 Theano 图进行分析,以确保:http ://deeplearning.net/software/theano/tutorial/profiling.html#tut-profiling

对于 cula,有一个 PR 提供了基于 NVIDIA 现在提供的 cusolver 的求解操作。所以这可能不再需要了。试试这个 PR:https ://github.com/Theano/Theano/pull/4917

于 2016-11-10T16:00:18.097 回答