html - 用于连续语音识别的 HTML5 语音输入 API

Question

我知道“x-webkit-speech”能够进行某种语音识别，实际上识别非常好。

我发现“x-webkit-speech”非常适合开发问答应用程序，您只需提出问题，系统就会识别问题并回答您。

但是，我正在寻找的是一种在浏览器中执行连续语音识别的方法。例如，如果我正在在线听讲座，我想实时转录教授正在谈论的内容。

“x-webkit-speech”可以吗？我的感觉是“x-webkit-speech”在检测到短暂的静默期时会自动停止，这很烦人。我知道它实际上将音频转换为 flac 并将其发送回谷歌服务器。是否可以发回更长的音频？我需要在网络上进行持续的语音识别。

score 1 · Accepted Answer

1 回答 1