probability - 如何在 HTK 中直接读取后验概率？

Question

问候小伙伴们，

我正在拼命地尝试在 htk 3.4 中找到我必须修改的文件，以便我可以直接读取语音的音素/单音素的后验概率序列，并将它们直接转发给解码器，同时考虑到声学和语言模型。

更详细地说，我正在遵循 HTK 教程，包括第 9 步，我只想在单声道上工作。我的（自己的，特定的）特征向量是具有每个音素 3 种状态概率的向量序列，类似于

(p(aa_begin), p(aa_mid), p(aa_end), ..., p(z_begin), p(z_mid), p(z_end))

对于话语中的每一帧，其中的条目，如上所述，已经是后验概率。

知道我需要修改哪些文件才能从我的（特定）文件（自己的二进制格式）中读取这些文件，以及如何将它们直接转发到解码器吗？最好让我可以使用 HVite 和 HEResult 来获得结果？

非常感谢您的帮助，G。

score 0 · Accepted Answer

我认为 HVite 上的选项 -f 将按照您希望的方式呈现结果。这是我发送的命令：

./HVite -T 1 -f -b sil -C config -a -H model/hmm7/macros -H model/hmm7/hmmdefs -i word1.mlf -m -t 250.0 -y lab -I word.mlf -S train.scp -L 标签/ dict.list phone1.list

这里是文件 word1.mlf 的开头（s2、s3、s4 是每个音素的开始中心和结尾）

"mfc/dr1_fcjf0_sa1.lab"

0 100000 s2 -48.580540 sil -1204.165527 sil

100000 400000 s3 -158.456665

400000 1900000 s4 -997.128357

1900000 2000000 s2 -75.405327 SH -530.110291 SHE

2000000 2500000 s3 -306.394897

2500000 2700000 s4 -148.310074

2700000 3000000 s2 -252.779510 IY -796.414673

3000000 3300000 s3 -214.586655

3300000 3700000 s4 -329.048492

probability - 如何在 HTK 中直接读取后验概率？

1 回答 1

Related

Reference