我正在尝试基于大量提取的 MFCC 特征生成通用背景模型 (UBM),但是MemoryError
当我将数据拟合到模型时,我一直得到一个。这是相关的代码部分:
files_features.shape
(2469082, 56)
gmm = GMM(n_components = 1024, n_iter = 512, covariance_type = 'full', n_init = 3)
gmm.fit(features)
有没有办法解决这个错误或者分解数据的处理以避免内存错误。我对这个领域很陌生,如果能得到任何帮助,我将不胜感激。
[更新]
不幸的是,这里提到的答案并不能解决我的问题,因为假设 data_set 具有低方差,而在我的情况下:
round(np.var(files_features), 3)
47.781
增量拟合可能是一种解决方案,但对于 GMMscikit-learn
没有这样的解决方案。partial_fit
我将不胜感激有关如何解决此问题的任何建议,无论是替代库建议、partial_fit 参考实现还是批量处理数据(在这种情况下不起作用,因为GMM.fit()
内存较少)?