4

即使我使用pickle后端,在Python中遵循明显简单的MCMC代码也会导致大量内存使用(> 15GB)。每当我在 pymc 中使用观察到的变量数组时,都会发生这种情况。知道为什么会这样吗?

import pymc as pymc
import numpy as np

N = 17
numC = 5

A = np.zeros([N,N])
A[0:numC, :] = 1
A[:, 0:numC] = 1

C = pymc.Beta('C', alpha=0.5, beta=0.5, size=N)

@pymc.deterministic(dtype=float)
def q(_C=C):
    Q = np.zeros([N,N])
    for i in range(0,N-1):
        for j in range(i+1, N):
            Q[i, j] = Q[j, i] = C[i] + C[j] - C[i]*C[j]

    return Q

obs = []
for i in range(0,N-1):
    for j in range(i+1, N):
        o = pymc.Bernoulli('A%d%d'%(i,j), p=q[i,j], value=A[i,j], observed=True)
        obs.append(o)

model = pymc.Model([C, q] + obs)

mcmc = pymc.MCMC(model, db='pickle', dbname='abc.pickle')
mcmc.sample(10000, burn=5000, thin=5)
mcmc.db.close()
4

1 回答 1

0
  1. 从个人经验来看,pickle 对大型对象的内存可能非常大,并且它通常会膨胀和增长而不会释放内存,正如我所见。
  2. 可以尝试使用内存分析器来检查内存增长发生在哪里,它允许装饰函数以查看在执行期间内存增长的漂亮绘图图。
于 2015-07-23T17:01:44.413 回答