我偶然发现了Google Speech API上的文章,它提出了一种通过 Perl 从音频文件中提取文本的机制。现在我已经录制了一个音频文件,您可以在http://vocaroo.com/i/s0lPN5d3YQJj找到它。这是一段简单的音频,阅读我爱你。当我在 Chrome 中访问 Google 语音 API 并说出这些话时,我得到了正确的结果。当我在上述链接中尝试使用我指出的音频文件的代码时,它会返回奇怪的结果,例如logan。我怎样才能使它更准确?这只是一个示例音频,我通常做的是通过 FFMpeg 使用类似的东西从视频文件中提取音频ffmpeg -i input.avi -vn -ar 44100 -ac 2 -ab 192 -f mp3 output.mp3
,然后是ffmpeg -i input.mp3 output.flac
.
问问题
473 次