什么是实时检测音频流的语音部分的简单方法:?我已经阅读了有关使用 MFCC、FFT 等的信息。但我找不到任何关于如何完成的明确解释。
此外,是否有任何 PC 程序可以分析 wav 文件并检测其中是否存在人类语音?
这个话题太复杂了……;没有简单的解决方案或明确的解释;有许多现有的技术和算法。现代技术涉及人工智能和机器学习算法,而不仅仅是诸如 FFT 或倒谱分析之类的琐碎 DSP 算法。但是,您可以尝试使用 Java 编写的 Sphinx-4,它自然是跨平台的。
http://cmusphinx.sourceforge.net/sphinx4/
我还没有尝试过,所以我不能说它的可用性,但请确保最好的算法已获得专利,并且真的非常昂贵......