0

我正在尝试将 sox 实现到语音识别程序中。但是,sox 用 5-7 个单词(文件大小也在 200-400kb 之间)非常简单的句子修剪单词需要将近 10 秒,这是不可接受的。我能做什么,或者哪些其他选项可以用于相同的目标。顺便说一下,我使用的 sox 参数是

sox -c 1 -r 16000 input.wav output.wav 静音 1 0.5 1% 1 0.1 1%:新文件:重启

4

0 回答 0