3

我正在尝试保存优化的高斯过程模型以用于不同的脚本。我目前的思路是将模型信息存储在 json 文件中,利用 GPy 的内置to_dictfrom_dict函数。类似于以下内容:

import GPy
import numpy as np
import json

X = np.random.uniform(-3.,3.,(20,1))
Y = np.sin(X) + np.random.randn(20,1)*0.05
kernel = GPy.kern.RBF(input_dim=1, variance=1., lengthscale=1.)

m = GPy.models.GPRegression(X, Y, kernel)

m.optimize(messages=True)
m.optimize_restarts(num_restarts = 10)

jt = json.dumps(m.to_dict(save_data=False), indent=4)
with open("j-test.json", 'w') as file:
    file.write(jt)

此步骤没有问题,但是当我尝试使用以下方法加载模型信息时遇到问题:

with open("j-test.json", 'r') as file:
    d = json.load(file)  # d is a dictionary

m2 = GPy.models.GPClassification.from_dict(d, data=None)

这给了我一个断言错误,因为“数据不是无”,它是——或者至少我是这样认为的。 断言错误

我对 GPy 和使用 jsons 真的很陌生,所以我真的不确定我在哪里误入歧途。我尝试查看文档,但文档有点模糊,我找不到它的使用示例。有没有我错过的步骤/概念?另外,这是存储和重新加载模型的最佳方式吗?对此的任何帮助将不胜感激!谢谢!

4

2 回答 2

3

模块泡菜是你的朋友!

import pickle
with open('save.pkl', 'wb') as file:
    pickle.dump(m, file)

您可以在以后的脚本中调用它:

with open('save.pkl', 'rb') as file:
    loaded_model = pickle.load(file)
于 2020-10-27T15:44:52.103 回答
0

没有建议将泡菜作为推荐的方法来执行此操作。请参阅此处,在最后的部分中。以下是相同的示例。

# let X, Y be data loaded above
# Model creation:
m = GPy.models.GPRegression(X, Y)
m.optimize()
# 1: Saving a model:
np.save('model_save.npy', m.param_array)
# 2: loading a model
# Model creation, without initialization:
m_load = GPy.models.GPRegression(X, Y, initialize=False)
m_load.update_model(False) # do not call the underlying expensive algebra on load
m_load.initialize_parameter() # Initialize the parameters (connect the parameters up)
m_load[:] = np.load('model_save.npy') # Load the parameters
m_load.update_model(True) # Call the algebra only once
print(m_load)
于 2021-10-28T15:49:19.360 回答