-4

我有 2 个音频 .wav 文件,由同一个人用同一个词录制。每个音频文件的格式为 16 位、44.1kHz,并且是单声道。如果是同一个人,我想知道如何比较这两个音频文件。我所知道的是处理文件以产生介于 -1 和 1 之间的值的浮点结果,并对其应用 fft 并比较频率。我想知道的是如何比较音频文件的 pcm,最好是显示比较的代码,如果可能的话,之前的步骤(处理成为值 btw 1 和 -1)。谢谢。我在这个领域相对较新,所以如果你们能帮助我,我将不胜感激。我目前正在使用地铁应用程序。我不想使用任何库,如 naudio 或 bass.net,但我仍然会接受任何答案。
非常感谢从使用 .wav 文件开始的逐步解决方案。我一直在尝试搜索与我正在做的事情相关的主题,但我发现的只是其中的一小部分。

4

2 回答 2

1

如果您想检测文件是否由同一个人制作,那么这比仅比较波形甚至进行快速傅立叶变换 (FFT) 复杂得多这是说话人识别的领域,已经有很多关于这个主题的研究论文。这不是一项简单的任务,为了到达任何地方,您需要具备信号处理技术的基础(除非您可以找到一个库来为您做这件事)。开始阅读它的好地方是Wikipedia 条目

本文概述了一些技术。常见的方法包括使用隐马尔可夫模型梅尔频率倒谱系数

于 2013-07-02T08:25:29.327 回答
-2

您不想以 .wav 格式进行比较。在 C# 中执行快速傅里叶变换 (FFT) 并比较http://en.wikipedia.org/wiki/Spectrogram

于 2013-07-02T05:34:32.037 回答