我正在尝试使用 Hmmlearn 来安装和训练 HMM,但是我收到了这个我不完全理解的奇怪警告:
用只有 550034 个数据点的 117917879 个自由标量参数拟合模型将导致退化解。
我使用了相当大的数据集,但我不明白 117917879 自由标量参数来自哪里,以及拥有退化解决方案意味着什么。
我定义我的嗯如下:
from hmmlearn import hmm
# vocab_size = 10858, is the number of states
model = hmm.GaussianHMM(n_components=vocab_size, covariance_type="full")
# frequency_list = list of length 1058, containing the initial probability of each state
model.start_prob_ = np.array(frequency_list)
# transitions is a (10858, 10858) containing the transition probabilities
model.transmat_ = np.array(transitions)
# integer_array = My data converted to an array (size = 550034)
integer_array = integer_array.reshape(-1,1)
model.fit(integer_array)
任何人都可以帮助我改进,或者至少解释标量参数的来源,以及退化的解决方案是什么?