我试图弄清楚是否有一种将两个 HMM 合并为一个的好方法,当基础状态相同但观察结果没有时间联系时。
我有两个独立的观察流来描述相同的隐藏状态空间。每个观察流的底层顺序保持不变,但它们不会同时发出。
例如,假设我有两个单独的扬声器大声朗读同一段文本的录音,其中隐藏状态空间成为文本中的字母,而来自每个音频的音素流构成观察空间。每个扬声器单独录制音频,并在阅读时使用不同的节奏。
我可以清楚地使用每个说话者独立地对文本进行预测,并在事后尝试协调结果……但我觉得将观察流组合成单个 HMM 可能会产生更好的结果。
有谁知道调和这个的好方法?