当得知 Google 终于发布了面向开发者的官方语音 API 时,我感到非常兴奋。我一直对 Google 的语音识别在 Android、Chrome 和其他产品中的出色表现感到惊讶。
我创建了一个 Google Cloud 帐户,启用了语音 API,并按照Google Speech API 文档创建了一些测试脚本。准确率超高,但速度慢得离谱。一个 18 秒的音频文件将花费他们的引擎大约 16 秒的时间来转录!Microsoft Bing Speech API 只需 3-4 秒即可完成!
有没有人有同样的经历?还是我的配置有问题?非常感谢任何帮助!
这是我使用的代码:
重击:
time curl "https://speech.googleapis.com/v1beta1/speech:syncrecognize?key={MY_API_KEY}" --header "Content-Type: application/json" --data '{"config":{"encoding":"FLAC","sample_rate":16000,"language_code":"en-US"},"audio":{"uri":"gs://accobot-speech/new_record.flac"}}'