0

我正在尝试使基于单声道的识别器适应特定的扬声器。我正在使用中给出的食谱HTKBook 3.4.1 section 3.6.2。我被困在HHEd我正在调用的部分上,比如 sp:

HHEd -A -D -T 1 -H hmm15/hmmdefs -H hmm15/macros -M classes regtree.hed monophones1eng

我最终得到的错误如下:
ERROR [+999] Components missing from Base Class list (2413 3375)
ERROR [+999] BaseClass check failed

该文件夹classes包含global具有以下内容的文件:
~b ‘‘global’’<br> <MMFIDMASK> *
<PARAMETERS> MIXBASE
<NUMCLASSES> 1
<CLASS> 1 {*.state[2-4].mix[1-25]}

里面的hmmdefs文件hmm15有一些混合组件(我在每个手机的每个状态使用 25 个混合组件)丢失。我试图通过给出具有随机均值和方差值但权重为零的混合分量来“填补空白”。这也没有效果。

hmms 是具有 5 个状态(3 个发射)的左右 hmms,每个状态由 25 个组件混合建模。每个组件依次由带有 EDA 组件的 MFCC 建模。总共有 46 部电话。

我的问题是:
1. 我调用的方式是否HHEd正确?单声道可以按上述方式调用吗?
2. 我知道基类列表 (rtree.base必须包含每个混合组件,但是我在哪里可以找到这些缺少的混合组件?

注意:如果需要更多信息,请告诉我。

编辑 1:文件 regtree.hed 包含以下内容:

RN "models"
LS "stats_engOnly_3_4"
RC 32 "rtree"

谢谢,
斯里拉姆

4

1 回答 1

1

他们调用 HHEd 的方式看起来不错。组件丢失,因为它们已失效。要处理失效的组件,请阅读 HTKBook-3.4.1 第 8.4 节第 137 页。

问题: - regtree.hed 包含什么?- 您使用了多少数据(以小时为单位)?25 种混合物可能过多。

您可能希望使用更逐渐增加的混合 - MU +1 或 MU +2 并限制混合的数量(猜测:3-8,具体取决于训练数据量)。

于 2011-07-08T09:24:21.163 回答