-1

我们已将 Nexmo Voice WebSocket API(电话)与 Google Voice Recognition API 连接起来,但质量很差。我们假设原因是采样率。Google 要求 16KHZ 但未上采样。Nexmo 支持吗?请参阅我们在https://www.youtube.com/watch?v=cIxS_CF3t00中的示例

4

1 回答 1

0

Nexmos 语音核心以 16 位/16kHz 运行,但我们仅限于电话公司向我们发送呼叫的任何音频,通常是 8Khz G.711 编解码器。

我们进行了上采样,但正如您发现的那样,这并不总是适用于语音识别 API。我自己还没有测试过 Google API,但它非常接近我的待办事项列表的顶部。同时,您可能想看看 IBM Watson API,因为它们有一个窄带语音模型,似乎在电话上工作得更好。这里有一些示例代码https://github.com/nexmo-community/voice-watson-speechtotext

于 2017-06-14T13:20:29.790 回答