我在 bash call spectgen 中使用了一个工具来计算 wav 文件的幅度。spectgen 的描述可在此处获得:http: //festvox.org/docs/speech_tools-1.2.0/x1717.htm#AEN1772。
我想得到的是根据时间的幅度值列表。所以我运行的命令是:
spectgen A_wav_filename.wav -otype xgraph -raw -shift 0.05 -o Output_file
然后我得到了一个格式如下的文件:
"track_0"
0.001 11.6221
0.002 15.3733
... ...
"track_1"
0.001 13.6334
0.002 15.4525
... ...
... ...
"track_127"
0.001 10.4165
0.002 12.1524
我不确定这首歌的实际含义。如描述中所述,它根据时间和通道及其幅度绘制 3-D 图。所以第一列肯定是时间,第二列应该是我认为的幅度?我猜“轨道”是指每个频道?如果是,那么如何计算每个时间点的幅度值?提前非常感谢。