0

如果可能的话,我需要一些意见或建议。我有一个使用语音识别 api 和媒体记录器的应用程序。该应用程序的要点是当用户说“note”时,它将记录语音消息,直到用户说“完成”。之后,该应用程序将语音消息保存到手机中。

我目前有一个带有按钮(记录、保存、停止、完成)的弹出框,用户手动按下按钮来录制他们的语音消息。我正在研究完全改变用户完全语音控制的应用程序。所以基本上,免提越多越好。

我从这里研究了连续语音识别:Android Speech Recognition as a service on Android 4.1 & 4.2但考虑到用户的语音录制时间可能会有所不同,我不完全确定它是否是一个好的解决方案。(我读到连续使用电池寿命真的很糟糕)

我研究并发现谷歌的语音识别是不可能的,因为它使用互联网发送单词,以便谷歌的服务器可以处理它。

我有点笨拙,如果我能得到一些建议或意见,那就太好了。

4

1 回答 1

0

user1704756,离线时谷歌语音识别无法帮助您。我认为你的需求类似于谷歌玻璃做的如下。

唤醒模型

“好的,谷歌眼镜。” 是不断检测到的唤醒词。当检测到唤醒字时,将发送内容以处理 ASR。

在您的项目中,“note”和“finish”是您的唤醒词,可以促进何时开始和停止。部分唤醒引擎提供语音数据回调,您可以从这里获取已移除唤醒词数据的数据。最重要的是,这很难实现。

据我所知,唤醒需要不断地记录语音和计算,所以对电池不友好。为了避免克服这个缺点,Moto X 手机使用了超低功耗的芯片来做到这一点。

它能帮助你。

于 2013-08-04T15:10:46.957 回答