集群/码本的数量,隐藏马尔可夫模型中的状态数量之间的关系是什么
状态数如何影响基于隐马尔可夫模型的分类器的性能?
集群/码本的数量,隐藏马尔可夫模型中的状态数量之间的关系是什么
状态数如何影响基于隐马尔可夫模型的分类器的性能?
一般情况下,如果状态个数不是很大,分类中的隐藏状态个数会增加准确率。如果状态数量很大,则精度不会再增加。并且隐藏状态数量的增加将导致更多的计算。
令N为状态数,T为状态和观察序列的长度:
如果要直接计算 P(Observations(up to t), State(t)=S| Model),则需要 2*T*(N^T) 的计算量。因此,尝试直接计算这个概率是一个坏主意。
相反,如果您希望使用前向后向算法,它需要 (N^2)*T 的计算量级,比直接方法快得多。
因此,对于 2 个状态和 10 个时间点,您需要进行 (2^2)*10= 40 次计算以获得 P(Observations(up to t), State(t)=S| Model)算法。
# States # Calculations
2 -> 40
3 -> 90
4 -> 160
5 -> 250
...