1

我正在尝试使用扬声器音频样本的 MFCC 功能创建 GMM 扬声器模型。对于特定的扬声器,我有 18 维 MFCC 特征。

要在 Java 中创建 GMM 模型,我有这个 GaussianMixture.java 类,它需要:

  1. 双[] 组件权重
  2. 矩阵[] 表示
  3. Matrix[] 协方差

你可以参考这里的课程GaussianMixture.java

我无法理解的是如何提供我提取的 MFCC 数据的均值和协方差。

我必须为means18 个维度中的每一个进行计算吗?如果是这样,那会是componentWeights什么?

如果我在某处不清楚,请纠正。谢谢。

4

1 回答 1

0

你必须运行EM 算法,它会估计高斯参数。或者你可以 MAP-adapt 现有的 GMM,MAP 适应需要的数据比训练少,但需要预训练的 GMM 模型。

有很多实现,例如here

于 2018-09-23T08:06:02.993 回答