2

我有超过 100 小时的音频与需要转录为文本的纪录片的视频采访相关联 - 希望每 30 秒左右有某种时间码标记,以便视频可以轻松匹配编辑中的文本套房。

这些文件是 BWAV 24 位 96khz 和 WAV 16 位 48khz,持续时间从 20 分钟到 2 小时不等。

需要在 VM 中设置哪些资源才能执行此类活动?我怀疑这将是相当密集的计算,因此 VM 可能需要 32 个内核和相当数量的内存,但不需要实时响应,因此如果优先级低并且处理文件需要几个小时就可以了。我的预算微乎其微——300 美元几乎是我们能负担得起的所有文件的最高费用(这是我们不以每小时 75 美元以上的价格将这些文件发送到转录服务的原因之一)。

我已经有一个云平台帐户,但从未使用过。如果有人已经做过类似的事情并且可以给我一些帮助,那么我在四处挣扎是没有意义的。

4

0 回答 0