speech-recognition - max/msp/jitter Sound - 语音分割/识别/分析

问问题 2014-11-24T12:59:03.323

761 次

-1

我正在尝试开发一个语音/声音识别程序，该程序可以提取一些有用的数据，例如有关声音的数据。例如..基频/MFCC/Centroid 等。语音通常以 20 到 30 ms 的帧进行分段，窗口分析偏移 10 ms。

我想找到一个补丁/对象或一些有用的建议，关于如何使用框架、移位、我更喜欢进行声音分析分割的步骤来实现窗口分割。

有人知道这样做的方法吗？

1 回答 1

0

你可以试试

ejs：http ://www.e--j.com/index.php/what-is-zsa-descriptors/
FTM 库中的 Gabor 对象 (gbr.*)：http: //ismm.ircam.fr/ftmco/

于 2014-12-03T14:01:12.377 回答