我想构建一个应用程序来分析麦克风语音的情感内容。
尽管有时用作额外功能,但这并不涉及语音识别。情绪分析基于声音的韵律特征(音高变化、速度等、音调)。
我知道这可以在台式计算机上完成,但我不希望用户必须将他们的录音(电话对话)上传到服务器才能获得情感反馈。
我需要的是一个提供整个分析的 API,或者一个我可以用来提取这些特征的 API(即对话的平均速度)。
外面有这样的东西吗?
提前致谢!
我想构建一个应用程序来分析麦克风语音的情感内容。
尽管有时用作额外功能,但这并不涉及语音识别。情绪分析基于声音的韵律特征(音高变化、速度等、音调)。
我知道这可以在台式计算机上完成,但我不希望用户必须将他们的录音(电话对话)上传到服务器才能获得情感反馈。
我需要的是一个提供整个分析的 API,或者一个我可以用来提取这些特征的 API(即对话的平均速度)。
外面有这样的东西吗?
提前致谢!
检查这个 OpenEAR 包,它应该提供最新状态的所有内容
http://sourceforge.net/projects/openart/
在这里阅读
http://www.mmk.ei.tum.de/publ/pdf/09/09eyb1.pdf
慕尼黑 openEAR 工具包是用于自动语音情感识别的完整软件包。它的首字母缩写词代表开放的情感和情感识别工具包。它基于openSMILE特征提取器,因此能够实时在线情感识别。包括在各种标准语料库上预训练的模型,以及用于快速构建和评估自定义模型集的脚本和工具。当前包含的分类器是使用 LibSVM 库的支持向量机。即将推出的还有双向长短期记忆递归神经网络、判别式多名义贝叶斯网络和惰性学习器。
openEAR 是在 GPL 许可下许可的免费软件。第一个版本(包括模型集和预编译的 openSMILE)将很快在 Sourceforge:openEAR 上发布。同时,请参考我们提供特征提取引擎的 openSMILE 项目。