我正在尝试使用 avconv 为 Google 的语音转文本制作一个 LINEAR16 原始文件,但是每当我尝试使用文档中的 play 命令播放它时,我会得到一个非常慢的文件:
play --rate=16000 --bits=16 --endian=little --encoding=signed-integer --channels=1 out.raw
进行这种转换的正确方法是什么?
我正在尝试使用 avconv 为 Google 的语音转文本制作一个 LINEAR16 原始文件,但是每当我尝试使用文档中的 play 命令播放它时,我会得到一个非常慢的文件:
play --rate=16000 --bits=16 --endian=little --encoding=signed-integer --channels=1 out.raw
进行这种转换的正确方法是什么?
它进行了一些实验,但我能够通过明确说明采样率、通道数和输出格式来使其工作:
avconv -i michael_queen_v._ed_schultz_cl.mp3 -f s16le -ac 1 -ar 16k out.raw
-f
:这会强制输出编码,因为.raw
它显然不足以知道该做什么。
-ac 1
: 单核细胞增多症
-ar 16k
:这听起来像一把枪,令人沮丧,但这会将采样率设置为 16000MHz。