algorithm - 为什么前向后向算法中的先验状态向量不是特征值为1的转移矩阵的特征向量？

Question

维基百科说您不知道第一个状态是什么，因此您必须在先前状态向量中为每个状态分配相等的概率。但是您确实知道转移概率矩阵是什么，并且该矩阵的特征值为 1 的特征向量是 HMM 中每个状态的频率（我认为），那么您为什么不先使用该向量而是状态向量？

score 2 · Accepted Answer

这确实是一个建模决策。您的建议当然是可能的，因为它几乎对应于在观察前加上大量观察，其中隐藏状态根本没有观察到或没有任何影响 - 这将使原始状态有时间稳定到平衡分配。

但是，如果您有一段带有分隔开头的观察，例如从说话者开始时开始的一段语音，或者从句子开头开始的一段文本，则没有特别的理由相信分布第一种状态与均衡分布相同：我非常怀疑“e”是否是句首最常见的字符，而众所周知，它是英文文本中最常见的字符。

你选择什么可能并不重要，除非你有很多非常短的观察序列要一起处理。大多数情况下，如果您想将状态概率之一设置为零，我只会担心，因为经常用于优化 HMM 参数的 EM 算法或 Baum-Welch 算法可能不愿意重新估计远离零的参数。

1 回答 1