2

我想在语音识别期间录制语音。根据识别语音的置信度,程序将保存或拒绝用户的语音。

要做到以上,我有两个选择:

  1. 从浏览器录制用户的声音并发送到 Node JS 服务器。然后将语音发布到 Google Speech API 并获得结果。基于置信度做动作。

  2. 在浏览器上识别和记录用户语音。如果识别置信度良好,则将语音发送到 Node JS 服务器进行保存。

第二种方式似乎不错,但我怎样才能获得用户语音的音频?

注意:语音将是连续的,文本的每个部分将持续大约一分钟。

环境:Google Chrome v49、HTML5(在浏览器端)。节点 JS(在服务器端)

谢谢你的帮助。

编辑#1(基于@raju的评论):

我试过以下代码

var recognition = new webkitSpeechRecognition();
recognition.continuous = true;
recognition.interimResults = true;
recognition.lang = "tr-TR";
recognition.onresult = function(event) { 
    console.log(event) 
}
recognition.start();

它可以工作,但它只返回语音识别的结果。我也想要原始声音数据。我查找了不同的事件及其“识别”对象的参数,但它们都不符合我的需求。有什么建议吗?

4

0 回答 0