0

我正在尝试创建一个可以通过启动指令激活的语音识别功能。我发现这个 雪人包可以创建一个启动指令监听器,它可以全时监听并在激活时运行某个任务。

我的问题是我需要在检测到启动指令时运行语音认证功能。假设我的启动指令是“你好”,我的语音验证输入需要是“你好,请开门”。但是如果我在检测到启动指令后开始录制,我需要重复单词 hello。我怎样才能在不重复的情况下获得完整的“你好,请开门”录音。

有没有办法让雪男孩输出它用来激活的短音频文件“你好”,如果是这样,那么我可以将它们组合起来。

如果现在我可以创建一个音频缓冲区,它将一直保存最后 10 秒的麦克风数据,而不会降低对 CPU 的影响。同时这也需要与雪人共享麦克风。

这是我的想法,但我不知道如何实现。请告诉我如何做到这一点或任何其他我可以获得完整录音的方法。

随意编辑问题是有些地方不清楚。

谢谢你!!

4

1 回答 1

0

是的。检测到后,Snowboy 默认播放资源文件夹中的“ding”波形文件。您可以编辑 snowboydecoder.HotwordDetector 函数来播放另一个声音文件而不是 ding(您可能需要粗略了解它的编译语言)。您可以下载自定义波形文件以在此处播放,或使用 Internet 上的各种免费 TTS API 列表来生成“机器人声音”自定义消息,并保存到您的计算机。如果需要,我将进行详细说明

于 2020-01-11T18:22:47.037 回答