1

我偶然发现了Google Speech API上的文章,它提出了一种通过 Perl 从音频文件中提取文本的机制。现在我已经录制了一个音频文件,您可以在http://vocaroo.com/i/s0lPN5d3YQJj找到它。这是一段简单的音频,阅读我爱你。当我在 Chrome 中访问 Google 语音 API 并说出这些话时,我得到了正确的结果。当我在上述链接中尝试使用我指出的音频文件的代码时,它会返回奇怪的结果,例如logan。我怎样才能使它更准确?这只是一个示例音频,我通常做的是通过 FFMpeg 使用类似的东西从视频文件中提取音频ffmpeg -i input.avi -vn -ar 44100 -ac 2 -ab 192 -f mp3 output.mp3,然后是ffmpeg -i input.mp3 output.flac.

4

1 回答 1

2

您是否尝试过播放您正在创建的音频文件?

您正在设置 192 位/秒的音频比特率,这非常低。

对于 192Kbps,您需要-ab 196608.

于 2012-08-04T18:16:35.793 回答