我正在尝试使用 Google 的 Cloud Speech API。这里有文档和代码示例:
https://cloud.google.com/speech/docs/basics
https://cloud.google.com/speech/docs/rest-tutorial
如果我将示例代码指向包含的文件 audio.raw,而不是简短的 .wav 文件,我可以让示例代码正常运行。
我不知道音频样本文件是什么格式:
$ file audio.raw
audio.raw: data
我的 .wav 文件可能有 10 秒的音频,我得到一个空的结果。
我知道这个答案。
之前有人问过我的问题,但没有答案。
我无法想象我必须正确获取音频文件的属性才能使其正常工作。我假设一个常见的用例,我的,是有人录制会议,不知道录制的参数,只想要一个文本文件。