0

我正在尝试使用 Python 制作说话人识别(不是语音而是说话人)系统。我已经提取mfcc了训练音频文件和测试音频文件的特征,并gmm为每个文件制作了一个模型。我不确定如何比较模型以计算相似度得分,据此我可以对系统进行编程以验证测试音频。我为完成这项工作而奋斗了 4 天。如果有人可以提供帮助会很高兴。

4

1 回答 1

0

根据我从问题中可以理解的内容,您正在描述鸡尾酒会问题一个方面渠道。

有趣的是,鸡尾酒会问题可以在 ocatve 的一行中解决:[W,s,v]=svd((repmat(sum(x.*x,1),size(x,1),1).*x)*x');
您可以在此 stackoverflow 帖子中阅读更多相关信息

于 2018-04-22T08:09:47.060 回答