你还记得在旧手机中,你可以制作一个语音快捷方式来打电话给一个人。
我正在尝试使用该功能在android中制作应用程序。用户录制想要控制应用程序的单词或声音,语音识别器只会检查它听到的声音是否等于之前录制的声音。
有谁知道如何制作或知道指南?我一直在寻找几个月没有找到令人满意的解决方案。
谢谢
你还记得在旧手机中,你可以制作一个语音快捷方式来打电话给一个人。
我正在尝试使用该功能在android中制作应用程序。用户录制想要控制应用程序的单词或声音,语音识别器只会检查它听到的声音是否等于之前录制的声音。
有谁知道如何制作或知道指南?我一直在寻找几个月没有找到令人满意的解决方案。
谢谢
您需要将参考声音和录制的声音都转换为特征。为此,您需要在帧上拆分声音并提取 FFT 或直接 mel-cepstrum。为此,您可以使用任何 MFCC 库。
获得特征后,您可以将它们与 DTW 算法进行比较。你可以在这里找到一些细节
http://en.wikipedia.org/wiki/Dynamic_time_warping
DTW 将返回您可以用来选择合适的人来呼叫的阈值。
类似的问题是