2

我已经提到了这个文档。他们在使用客户端库进行语音转文本时提到了“长音频流(长达 10 分钟)”。

语音转文本是否接受大于 10 分钟的音频文件?如果我们通过音频文件 > 10 分钟会发生什么?

在我的用例中,我需要传递超过 30 分钟的音频文件。那么对于这些​​情况我们该怎么办呢?

4

1 回答 1

0

您可以使用 ffmpeg 以编程方式拆分较长的音频流,并将这些块传递给此客户端库。您可以检查此项以编程方式将长音频流划分为时间指定的块:https ://superuser.com/questions/525210/splitting-an-audio-file-into-chunks-of-a-specified-length 。

然后,您可以组合这些块中的文本以获取整个文本。不是最干净的方式 - 但可以扩展。

于 2017-12-04T21:39:00.840 回答