我正在做一个项目,我需要使用 Speech to text 在我的网站中进行搜索。我正在使用谷歌云语音 API 同步 REST API。我在 WebRTC getUserMedia() 库的帮助下从浏览器获取音频。
我目前录制音频的配置是:线性 16、16 位单声道、48KHz。
我还添加了相关的短语提示:首字母缩略词、常用词等。
我面临的问题是,Google Demo 中的准确性远远好于我在应用程序中获得的结果。这里:https ://cloud.google.com/speech/
我正在做一个项目,我需要使用 Speech to text 在我的网站中进行搜索。我正在使用谷歌云语音 API 同步 REST API。我在 WebRTC getUserMedia() 库的帮助下从浏览器获取音频。
我目前录制音频的配置是:线性 16、16 位单声道、48KHz。
我还添加了相关的短语提示:首字母缩略词、常用词等。
我面临的问题是,Google Demo 中的准确性远远好于我在应用程序中获得的结果。这里:https ://cloud.google.com/speech/