2

维基百科说您不知道第一个状态是什么,因此您必须在先前状态向量中为每个状态分配相等的概率。但是您确实知道转移概率矩阵是什么,并且该矩阵的特征值为 1 的特征向量是 HMM 中每个状态的频率(我认为),那么您为什么不先使用该向量而是状态向量?

4

1 回答 1

2

这确实是一个建模决策。您的建议当然是可能的,因为它几乎对应于在观察前加上大量观察,其中隐藏状态根本没有观察到或没有任何影响 - 这将使原始状态有时间稳定到平衡分配。

但是,如果您有一段带有分隔开头的观察,例如从说话者开始时开始的一段语音,或者从句子开头开始的一段文本,则没有特别的理由相信分布第一种状态与均衡分布相同:我非常怀疑“e”是否是句首最常见的字符,而众所周知,它是英文文本中最常见的字符。

你选择什么可能并不重要,除非你有很多非常短的观察序列要一起处理。大多数情况下,如果您想将状态概率之一设置为零,我只会担心,因为经常用于优化 HMM 参数的 EM 算法或 Baum-Welch 算法可能不愿意重新估计远离零的参数。

于 2012-07-24T04:53:37.003 回答