8

我在理解 Baum-Welch 算法的确切工作原理时遇到了一些问题。我读到它调整了 HMM 的参数(转换和发射概率),以最大化给定模型可以看到我的观察序列的概率。

但是,如果我有多个观察序列会发生什么?我想针对大量观察训练我的 HMM(我认为这是通常所做的)。

例如, ghmm可以为该方法获取单个观察序列和完整的观察集baumWelch

它在两种情况下的工作方式相同吗?还是算法必须同时知道所有观察结果?

4

1 回答 1

9

在 Rabiner 的论文中,GMM 的参数(权重、均值和协方差)在 Baum-Welch 算法中使用这些方程重新估计:

在此处输入图像描述

这些仅适用于单个观察序列的情况。在多重情况下,分子和分母只是对所有观察序列求和,然后除以得到参数。(可以这样做,因为它们仅代表职业计数,请参见论文的第 273 页)

因此,在调用算法期间不需要知道所有观察序列。例如,HTK 中的HERest工具有一种机制,允许在多台机器之间拆分训练数据。每台机器计算分子和分母并将它们转储到文件中。最后,单机读取这些文件,将分子和分母相加,然后除以得到结果。见第 4 页。129之HTK书 v3.4

于 2014-05-30T15:59:27.637 回答