0

向 Google Speech API 团队提出的问题/请求:Google Speech 是否可以为 AAC 编码提供转录?

背景 --- 我们正在开发一款可在 iOS 和 Android 平台上运行的移动应用程序。AAC 是这两个平台上唯一支持的编码。出于性能和成本的原因,能够从 Google 获得 AAC 编码的转录很重要。我们希望避免将 AAC 编码转换为 Google 支持的编码的步骤。

使用有损编码的目的是拥有更小的音频文件——这对于有效使用存储、内存和带宽资源很重要。由于 AAC 是 iOS 和 Android 上唯一可用的编码,如果 Google 语音可以支持 AAC 编码将非常有帮助。

参考:https ://cloud.google.com/speech/docs/basics讨论了 Google Speech API 为其提供转录的所有编码。希望 Google Speech 团队将 AAC 编码添加到列表中。

摘要——我们需要将 AAC 编码发送到 Google Speech API 并获取此编码的转录。如果 Google Speech 团队的任何人正在阅读这篇文章,我将不胜感激 --- Speech 团队是否计划将 AAC 编码添加到 cloud.google.com/speech/docs/basics 中支持的编码列表中?

4

1 回答 1

0

我们正在开发一个移动应用程序...

您的应用应使用 API 转录音频。Android SDK 可以将您的 AAC 数据解压缩为原始数字音频 (PCM)。如果您必须向.wavAPI 提供,则只需为 PCM 以 WAVE 格式制作一个 44 字节的标头。将所有内容(标题 + PCM 数据)放入一个字节数组并提供给 API。

AAC 不是音频。必须解码压缩数学以恢复 PCM(波形)音频数据。您可能正在存储 AAC "for efficient use of storage, memory...",但设备仍在播放该设备 RAM 中保存的(临时)大型 Wave 文件。

于 2017-12-13T05:06:50.993 回答