2

我不太喜欢音频工程,所以请放轻松。我正在接收一个音频文件作为输入,并且需要检测说话者是男性还是女性。任何想法如何去做这件事?

我正在使用 php,但对使用其他语言持开放态度,只要时间与任务相称,不介意学习一点合理的理论。

4

4 回答 4

6

我无法对这个问题提供具体的见解,但我会先阅读以下文章:Gender Classification from Speech

这至少应该让您了解所涉及的概念/方法(据我所知,本文对此进行了很好的描述)。

于 2010-06-16T21:34:47.830 回答
3

首先,您必须找到音高值,并且可以在这篇文章中找到一种用于查找语音音高值的出色算法:http ://www.fon.hum.uva.nl/paul/papers/Proceedings_1993.pdf 。

它非常准确。

于 2010-06-18T15:04:14.233 回答
2

我和 Christophe 在一起,因为我在这方面没有太多经验,而且我认为一些研究将是你最好的途径。

如果我不得不对此进行尝试,我猜想这将涉及使用傅里叶变换计算样本的频谱,然后找出平均频率的位置。为不同的文化和语言建立大量的男性与女性样本,然后将您的特定样本的平均频率与男性与女性的既定平均值进行比较。

不过我可能完全错了,所以研究真的是你最好的选择。

于 2010-06-16T21:40:02.750 回答
1

一种方法是使用人工神经网络。您为神经网络提供了一些训练示例,它有望学会正确分类声音。您可能必须使用傅里叶变换进行一些特征提取,才能将数据转换为合适的形式。

如果您在 Google 上搜索“神经网络说话人识别”,有几篇关于这种方法的论文,但不幸的是,我对它们不够熟悉,无法推荐任何特定的方法。

于 2010-06-17T00:32:32.113 回答