我想制作一个简单的游戏,通过麦克风比较给定单词的发音,该单词作为音频文件提供,与玩家发音的相同单词。我所说的发音是指单词的“声音”应该与给定的单词进行比较。
如果系统能够返回玩家发音单词与给定单词的接近程度的百分比,那将是理想的。
我在 StackOverflow 中发现了有关音频指纹和语音识别的问题。他们似乎表明,这是一个非常困难的问题。但是由于我不需要完整的语音识别,所以我错过了一种更简单的方法。
所以我的问题是:这是否可行?如果可行,我该如何解决这个问题?有没有可以支持我的库。
你不能在 JavaScript 中做到这一点,但我对这个问题的回答概述了解决问题的方法。您可能需要使用 C++,因为相关的 SAPI 接口并未真正通过 C# 公开。