-1

我正在尝试开发一个语音/声音识别程序,该程序可以提取一些有用的数据,例如有关声音的数据。例如..基频/MFCC/Centroid 等。语音通常以 20 到 30 ms 的帧进行分段,窗口分析偏移 10 ms。

我想找到一个补丁/对象或一些有用的建议,关于如何使用框架、移位、我更喜欢进行声音分析分割的步骤来实现窗口分割。

有人知道这样做的方法吗?

4

1 回答 1

0

你可以试试

于 2014-12-03T14:01:12.377 回答