2

我目前正在使用隐藏马尔可夫模型做一个说话人验证项目,还没有准确的语音信号结果,尽管我已经测试了系统的各种数据样本(不涉及语音)。

我使用 scikits talkbox 提取了语音信号的 MFCC。我假设不必更改任何参数,并且默认参数已经适合此类项目。我怀疑我的问题在于 mfcc 向量的向量量化。我使用 scipy 的 kmeans 聚类函数选择了 kmeans 作为我的算法。我想知道这种工作是否有规定数量的集群。我最初将我的设置为 32。我的语音文件的采样率为 8000 和 22050。哦,另外,我录制了它们并使用 Audacity 手动删除了静音。

有什么建议么?

4

0 回答 0