我正在做一个程序情感识别语音。
使用 mfcc + K-mean + GMM,我得到的可能性是 -15012、-43400、-8000
不过,它的价值比我大得多。是正确的价值吗?
Wave 文件的长度通常为 2~3,我使用以下选项进行初始化。
MFCC option
SampleRate = 16000
WindowSize = 256
NumberCoefficients = 13
UseFirstCoefficient = true
MinFreq = 20.0
MaxFreq = 16000.0
NumberFilters = 25
K-Means Clustering default option
NumberCluster = 2