1

我正在尝试用 hmmlearn 拟合一个模型,给定一个转换矩阵和一个先验发射矩阵。拟合后,它在转换矩阵中给出了一些负值。

转移矩阵由另一个模型的转移矩阵恢复。

我的意思的示例代码是:

>>> model
GaussianHMM(algorithm='viterbi', covariance_type='diag',covars_prior=0.01,
  covars_weight=1, init_params='stmc', means_prior=0, means_weight=0,
  n_components=3, n_iter=100, params='stmc', random_state=123,
  startprob_prior=1.0, tol=0.5, transmat_prior=1.0, verbose=True)
>>> model.transmat_
array([[  9.95946216e-01,   2.06359396e-21,   4.05378401e-03],
   [  2.05184679e-21,   9.98355526e-01,   1.64447392e-03],
   [  3.86689326e-03,   1.96383373e-03,   9.94169273e-01]])
>>> new_model= hmm.GaussianHMM(n_components=model.n_components,
random_state=123,
... init_params="mcs", transmat_prior=model.transmat_)

>>> new_model.fit(train_features)
GaussianHMM(algorithm='viterbi', covariance_type='diag', covars_prior=0.01,
      covars_weight=1, init_params='mcs', means_prior=0, means_weight=0,
      n_components=3, n_iter=10, params='stmc', random_state=123,
      startprob_prior=1.0, tol=0.01,
      transmat_prior=array([[  9.95946e-01,   2.06359e-21,   4.05378e-03],
       [  2.05185e-21,   9.98356e-01,   1.64447e-03],
       [  3.86689e-03,   1.96383e-03,   9.94169e-01]]),
      verbose=False)
>>> new_model.transmat_
array([[  9.98145253e-01,   1.86155258e-03,  -7.08313729e-06],
       [  2.16330448e-03,   9.93941859e-01,   3.89483667e-03],
       [ -5.44842863e-06,   3.52862069e-03,   9.96478546e-01]])
>>> 

在代码中显示的训练数据也是相同的。例如,如果我不使用先验的转换矩阵而是使用发射,它可以正常工作。我正在使用 Anaconda 2.5 64 位。hmmlearn 版本是 0.2.0

暗示?谢谢

4

1 回答 1

1

tl;博士确保transmat_prior> = 1。

隐马尔可夫模型的 EM 算法是使用状态指示变量推导出来z的,这些变量保持每个时间步的马尔可夫链的状态t。以先前状态为条件z[t - 1]z[t]遵循由转移概率矩阵定义的参数的分类分布。

hmmlearn实现了隐马尔可夫模型的MAP学习,这意味着每个模型参数都有一个先验分布。具体来说,假设转移矩阵的每一行都遵循参数为 的对称狄利克雷分布transmat_prior。先验的选择不是随机的,Dirichlet 分布与分类分布是共轭的。这在 EM 算法的 M-step 中产生了一个简单的更新规则:

transmat[i, j] = (transmat_prior[i, j] - 1.0 + stats["trans"][i, j]) / normalizer

其中是和stat["trans"][i, j]之间的预期转换次数。ij

从更新规则可以清楚地看出,如果 a)对于某些人来说 <1,并且b) 期望值不足以弥补这一点,则转换概率可能会变为负数。transmat_priorijstats["trans"]

这是分类分布的 MAP 估计中的一个已知问题,一般建议是要求transmat_prior所有状态 >=1。

于 2016-02-28T23:09:44.540 回答