使用 GPU 与 CPU 时,我发现 PYMC3 速度的差异为零。
我正在拟合一个需要 500K+ 样本才能收敛的模型。显然它很慢,所以我尝试使用 GPU 加快速度(在 EC2 上使用 GPU 实例)。Theano 报告正在使用 GPU,所以我相信 CUDA/Theano 配置正确。但是,我强烈怀疑 Pymc3 没有使用 GPU。
- 我需要将我的变量显式设置为 TensorType(float32, scalar) 吗?目前,它们是 float64。
- 只有一些采样器/可能性可以从 CUDA 中受益吗?我正在拟合基于泊松的模型,因此使用 Metropolis 采样器,而不是 NUTS
- 有没有办法检查 pymc3 是否正在使用 GPU?