我已经提到了这个文档。他们在使用客户端库进行语音转文本时提到了“长音频流(长达 10 分钟)”。
语音转文本是否接受大于 10 分钟的音频文件?如果我们通过音频文件 > 10 分钟会发生什么?
在我的用例中,我需要传递超过 30 分钟的音频文件。那么对于这些情况我们该怎么办呢?
我已经提到了这个文档。他们在使用客户端库进行语音转文本时提到了“长音频流(长达 10 分钟)”。
语音转文本是否接受大于 10 分钟的音频文件?如果我们通过音频文件 > 10 分钟会发生什么?
在我的用例中,我需要传递超过 30 分钟的音频文件。那么对于这些情况我们该怎么办呢?
您可以使用 ffmpeg 以编程方式拆分较长的音频流,并将这些块传递给此客户端库。您可以检查此项以编程方式将长音频流划分为时间指定的块:https ://superuser.com/questions/525210/splitting-an-audio-file-into-chunks-of-a-specified-length 。
然后,您可以组合这些块中的文本以获取整个文本。不是最干净的方式 - 但可以扩展。