3

你还记得在旧手机中,你可以制作一个语音快捷方式来打电话给一个人。

我正在尝试使用该功能在android中制作应用程序。用户录制想要控制应用程序的单词或声音,语音识别器只会检查它听到的声音是否等于之前录制的声音。

有谁知道如何制作或知道指南?我一直在寻找几个月没有找到令人满意的解决方案。

谢谢

4

1 回答 1

1

您需要将参考声音和录制的声音都转换为特征。为此,您需要在帧上拆分声音并提取 FFT 或直接 mel-cepstrum。为此,您可以使用任何 MFCC 库。

获得特征后,您可以将它们与 DTW 算法进行比较。你可以在这里找到一些细节

http://en.wikipedia.org/wiki/Dynamic_time_warping

DTW 将返回您可以用来选择合适的人来呼叫的阈值。

类似的问题是

测量两个短音频相似度的最简单算法

于 2013-04-05T20:17:52.577 回答