我正在为我的计算机科学论文做一个项目。它旨在实现一个应用程序,该应用程序允许用户在个人电脑或智能手机的麦克风中唱歌或吹口哨,并识别已唱出哪些音符。
我需要首先研究作为此类程序基础的理论,然后在 matlab、java 或 c 中实现它。
我已经在 Stackoverflow 上找到了很多信息,但我有点困惑(关于 FFT、音高等)。如果有人能告诉我我应该学习什么以及实施的步骤是什么,我将不胜感激。
如果你试图从头开始做这一切,我认为这对于一个人来说是不可行的。但是,如果您将现有的部分整合在一起,这可能是可行的。
我会先寻找一些开源库并按原样尝试它们。这可能会对您可以做的事情施加一些限制。不过没关系,因为整个东西都很大。不知何故,首先集成一个快速而肮脏的解决方案可能是有意义的。例如,通过获取录制的声音文件并使用库来识别那里的声音。然后添加与其他东西的集成,精美的输出,录音等。
我的意思是这样的: https ://dsp.stackexchange.com/a/2462
周围可能有也可能没有太多开放的东西,因为对此类事物的商业兴趣似乎很高。