我想制作一个iOS应用来计算疑问句。我会寻找 WH 问题以及“我会,是吗?” 格式问题。
我不是很了解语音或音频技术,但我做了谷歌,发现语音识别 SDK 很少。但仍然不知道如何检测和绘制语调。是否有任何支持语调或情感语音识别的 SDK?
我想制作一个iOS应用来计算疑问句。我会寻找 WH 问题以及“我会,是吗?” 格式问题。
我不是很了解语音或音频技术,但我做了谷歌,发现语音识别 SDK 很少。但仍然不知道如何检测和绘制语调。是否有任何支持语调或情感语音识别的 SDK?
AFAIK 没有基于云的语音识别 SDK,它也可以为您提供语调。您可以搜索音高跟踪解决方案并从音高轮廓中得出语调。librosa
Python 包中提供了一个开源的:
https://librosa.org/librosa/generated/librosa.core.piptrack.html
如果您无法在应用程序中嵌入 Python,则始终可以选择在 REST API 中使用Flask
或来提供它fastapi
。