vector - Python - 聚类 MFCC 向量

翻译自：https://stackoverflow.com/questions/22359801 2014-03-12T17:50:15.330

1296 次

我目前正在使用隐藏马尔可夫模型做一个说话人验证项目，还没有准确的语音信号结果，尽管我已经测试了系统的各种数据样本（不涉及语音）。

我使用 scikits talkbox 提取了语音信号的 MFCC。我假设不必更改任何参数，并且默认参数已经适合此类项目。我怀疑我的问题在于 mfcc 向量的向量量化。我使用 scipy 的 kmeans 聚类函数选择了 kmeans 作为我的算法。我想知道这种工作是否有规定数量的集群。我最初将我的设置为 32。我的语音文件的采样率为 8000 和 22050。哦，另外，我录制了它们并使用 Audacity 手动删除了静音。

有什么建议么？

vector - Python - 聚类 MFCC 向量

0 回答 0

Related

Reference