我正在尝试使用http://scikit-learn.org/stable/modules/model_persistence.html中所述的 joblib 在 Sci-Kit Learn 中实现模型持久性。但是,当我重新加载模型时,我发现模型 coef_ 矩阵的所有行都设置为零,除了第一行。
joblib.dump(RidgeTfIDF,'/Users/gireesh/Documents/NBC_Chris/modeling/Pickled Models/RidgeESTfIDF11_02_2015_30.pkl')
R2 = joblib.load('/Users/gireesh/Documents/NBC_Chris/modeling/Pickled Models/RidgeESTfIDF11_02_2015_30.pkl')
R2.coef_[1].nonzero()
给出:
Out[95]: (array([], dtype=int64),)
而 RidgeTfIDF.coef_[1].nonzero()
给
Out[96]: (array([ 0, 1, 6, ..., 1048563, 1048565, 1048569]),)
当我使用 np.save 将 RidgeTfIDF.coef_ 的每一行保存在一个单独的文件中,然后从这些文件中重新加载时,模型工作正常。但是,这要慢得多,我想改为解决 joblib 问题。