python - 使用 Python 的说话人识别系统

Question

我正在尝试使用 Python 制作说话人识别（不是语音而是说话人）系统。我已经提取mfcc了训练音频文件和测试音频文件的特征，并gmm为每个文件制作了一个模型。我不确定如何比较模型以计算相似度得分，据此我可以对系统进行编程以验证测试音频。我为完成这项工作而奋斗了 4 天。如果有人可以提供帮助会很高兴。

score 0 · Accepted Answer

根据我从问题中可以理解的内容，您正在描述鸡尾酒会问题的一个方面渠道。

有趣的是，鸡尾酒会问题可以在 ocatve 的一行中解决：[W,s,v]=svd((repmat(sum(x.*x,1),size(x,1),1).*x)*x');
您可以在此 stackoverflow 帖子中阅读更多相关信息

python - 使用 Python 的说话人识别系统

1 回答 1

Related

Reference