我正在进行一个个人项目,该项目涉及开发一个系统,该系统将自动从全长轨道生成音频缩略图剪辑(大约 30 秒长)。
为了做到这一点,我想查看音频的能量和音高,以尝试正确识别其主要结构特征。
是否有任何可用的开源软件可以进行能量/音高提取?如果没有,我将开始研究使用 MATLAB 的替代方法。
谢谢!
我正在进行一个个人项目,该项目涉及开发一个系统,该系统将自动从全长轨道生成音频缩略图剪辑(大约 30 秒长)。
为了做到这一点,我想查看音频的能量和音高,以尝试正确识别其主要结构特征。
是否有任何可用的开源软件可以进行能量/音高提取?如果没有,我将开始研究使用 MATLAB 的替代方法。
谢谢!
YAAFE (Yet Another Audio Feature Extractor) http://yaafe.sourceforge.net/在 MATLAB、Python 和 C 中进行音频特征提取。
试试JAudio,它可以从音频中提取特征。
您可能想查看Echo Nest API。它有很多音频分析功能,而且我知道 Remix 包中捆绑了一个脚本,可以自动将歌曲转换为更短或更长的版本(我相信该脚本称为 earworm)。
大胆可能会这样做。
MARSYAS contains bextract for analysis, can find MFCCs and various other timbral and spectral features. http://marsyas.info/