perl - 在文件中发送音频时，Google Speech API 不给出正确的结果

Question

我偶然发现了Google Speech API上的文章，它提出了一种通过 Perl 从音频文件中提取文本的机制。现在我已经录制了一个音频文件，您可以在http://vocaroo.com/i/s0lPN5d3YQJj找到它。这是一段简单的音频，阅读我爱你。当我在 Chrome 中访问 Google 语音 API 并说出这些话时，我得到了正确的结果。当我在上述链接中尝试使用我指出的音频文件的代码时，它会返回奇怪的结果，例如logan。我怎样才能使它更准确？这只是一个示例音频，我通常做的是通过 FFMpeg 使用类似的东西从视频文件中提取音频ffmpeg -i input.avi -vn -ar 44100 -ac 2 -ab 192 -f mp3 output.mp3，然后是ffmpeg -i input.mp3 output.flac.

score 2 · Accepted Answer

您是否尝试过播放您正在创建的音频文件？

您正在设置 192 位/秒的音频比特率，这非常低。

对于 192Kbps，您需要-ab 196608.

perl - 在文件中发送音频时，Google Speech API 不给出正确的结果

1 回答 1

Related

Reference