0

我正在做一个程序情感识别语音。

使用 mfcc + K-mean + GMM,我得到的可能性是 -15012、-43400、-8000

不过,它的价值比我大得多。是正确的价值吗?

Wave 文件的长度通常为 2~3,我使用以下选项进行初始化。

MFCC option 
SampleRate = 16000 
WindowSize = 256 
NumberCoefficients = 13
UseFirstCoefficient = true 
MinFreq = 20.0 
MaxFreq = 16000.0 
NumberFilters = 25 
K-Means Clustering default option 
NumberCluster = 2
4

1 回答 1

1

可能性的实际值取决于特征提取过程中使用的许多参数。例如,filterbank 可能以不同的方式创建。它们在不同的引擎中是不同的。所以只看这些值你不能说它们是否正确。

由于您没有提及引擎,因此无法回答这个问题。

于 2012-09-13T08:33:46.453 回答