Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我正在尝试通过并行化加速 pymc3 采样,但我只看到了适度的好处。
我能够在 i7 MacBook Pro 上将总运行时间从 25 分钟 (njobs=1) 减少到 13 分钟 (njobs=6)。由于 pymc 实际开始采样大约需要 4 分钟,因此增加幅度相对较小。
问题是 - 有没有人成功地将 GPU 与 pymc3 一起使用,对于需要 6-8 分钟采样的模型,我可以获得多少好处?(我的 MacBook 有 nvidia GT 750M 2Gb)
我在 Intel i7-4930 上运行 Linux。
我运行了一个 PyMC3 模型,在 CPU 上运行了 90 分钟(使用所有内核),但在我的 GeForce GTX 970 上只用了 18 分钟。
所以加速了近 5 倍。