0

我有一个文本文件形式的二维数据。我必须使用 Sidekit 1.2 基于这些数据构建 GMM。

我应该使用哪个函数来估计高斯模型的参数(均值、协方差矩阵、加权平均等)

您能否提供一个带有您自己的 (x,y) 数据集的小示例并使用它构建 GMM?

任何帮助将不胜感激。

4

1 回答 1

0

Sidekit 是一个主要为说话人识别任务而构建的工具包,它的框架(与其他类似的工具包一样)依赖于由 .wav、.sph 或原始 PCM 格式的音频文件组成的训练数据。如果您只是构建 GMM 并且不打算将其用于说话人识别实验,我建议您使用另一个工具包用于一般统计目的(scikit-learn可能是一个不错的选择)。

如果您确实计划执行说话人识别任务,则必须对数据进行一些初步工作。如果您的文本数据是某种形式的扬声器数据,您可以将其转换为适当的格式。例如,如果 y 部分是原始音频,则将其转换为 wav 文件。如果 y 是倒谱特征或其他特征,则以 h5.-format 存储。完成此操作后,您可以按照 Sidekit 主页上的教程构建用于说话人识别任务的 GMM。

于 2017-05-30T13:06:02.033 回答