1

这是一篇论文,它是关于估计包含文本和一些噪声或非文本对象的二进制图像的透视。

PDF文件

该算法使用隐马尔可夫模型:实际上两个条件 T - 文本 B - 背景(即噪声)

算法本身很难理解。问题是我已经阅读了有关隐马尔可夫模型的内容,并且我知道它使用必须知道的概率。但是在这个算法中我无法理解,如果他们使用 HMM,他们如何获得这些概率(将状态从 S1 更改为另一个状态的概率,例如 S2)?

我在那篇论文中也没有找到任何关于培训的内容。所以,如果有人理解它,请告诉我。还有可能在不知道状态变化概率的情况下使用 HMM 吗?

编辑:可能他们正在使用一些估计,而不知道 HMM 参数(概率)

4

1 回答 1

2

也许这有点太学术了,与应用数学有关而不是与编程有关?

无论如何:HMM 传统上是通过使用一些已经分类数据的数据库来训练的(即学习模型参数的值,在这种情况下是概率)。请参阅Baum Welch 算法。这种分为两个阶段的划分:首先学习(或训练)(使用分类标记的数据),然后分类(或实际工作)(使用未分类的数据)是许多算法的典型特征,称为监督分类

另一方面,有时我们没有“已知”(分类)数据,因此我们必须求助于无监督分类,在这种分类中,我们尝试同时学习模型和分类。这更加有限,通常意味着对模型进行许多简化和减少参数(这样我们就没有太多东西要学习了)。乍一看,这似乎是那篇​​文章中的路径:他们不考虑一个完全通用的 HMM,而是一个非常有限的 HMM,并尝试找到一个适合该模型的模型。但是,再一次,我没有认真阅读它。

于 2010-04-23T20:26:29.773 回答