我知道“x-webkit-speech”能够进行某种语音识别,实际上识别非常好。
我发现“x-webkit-speech”非常适合开发问答应用程序,您只需提出问题,系统就会识别问题并回答您。
但是,我正在寻找的是一种在浏览器中执行连续语音识别的方法。例如,如果我正在在线听讲座,我想实时转录教授正在谈论的内容。
“x-webkit-speech”可以吗?我的感觉是“x-webkit-speech”在检测到短暂的静默期时会自动停止,这很烦人。我知道它实际上将音频转换为 flac 并将其发送回谷歌服务器。是否可以发回更长的音频?我需要在网络上进行持续的语音识别。