python-3.x - 使用 SIDEKIT 1.2 构建 GMM

Question

我有一个文本文件形式的二维数据。我必须使用 Sidekit 1.2 基于这些数据构建 GMM。

我应该使用哪个函数来估计高斯模型的参数（均值、协方差矩阵、加权平均等）

您能否提供一个带有您自己的 (x,y) 数据集的小示例并使用它构建 GMM？

任何帮助将不胜感激。

score 0 · Accepted Answer

Sidekit 是一个主要为说话人识别任务而构建的工具包，它的框架（与其他类似的工具包一样）依赖于由 .wav、.sph 或原始 PCM 格式的音频文件组成的训练数据。如果您只是构建 GMM 并且不打算将其用于说话人识别实验，我建议您使用另一个工具包用于一般统计目的（scikit-learn可能是一个不错的选择）。

如果您确实计划执行说话人识别任务，则必须对数据进行一些初步工作。如果您的文本数据是某种形式的扬声器数据，您可以将其转换为适当的格式。例如，如果 y 部分是原始音频，则将其转换为 wav 文件。如果 y 是倒谱特征或其他特征，则以 h5.-format 存储。完成此操作后，您可以按照 Sidekit 主页上的教程构建用于说话人识别任务的 GMM。

python-3.x - 使用 SIDEKIT 1.2 构建 GMM

1 回答 1

Related

Reference