这是一篇论文,它是关于估计包含文本和一些噪声或非文本对象的二进制图像的透视。
该算法使用隐马尔可夫模型:实际上两个条件 T - 文本 B - 背景(即噪声)
算法本身很难理解。问题是我已经阅读了有关隐马尔可夫模型的内容,并且我知道它使用必须知道的概率。但是在这个算法中我无法理解,如果他们使用 HMM,他们如何获得这些概率(将状态从 S1 更改为另一个状态的概率,例如 S2)?
我在那篇论文中也没有找到任何关于培训的内容。所以,如果有人理解它,请告诉我。还有可能在不知道状态变化概率的情况下使用 HMM 吗?
编辑:可能他们正在使用一些估计,而不知道 HMM 参数(概率)