我想用 cmusphinx 为中国 14 岁以下儿童建立一个英语声学模型,词汇量约为 800 个单词。
我做了一些研究,一些商业语音引擎需要数千小时的语音记录来训练他们的声学模型:(nuance 和 google 花了 2000+ 和 1000+ 小时)。
因为我需要达到大约 95% 的准确率,语音语料库需要多少小时?
是不是语音语料越长,准确率就越高?
我想用 cmusphinx 为中国 14 岁以下儿童建立一个英语声学模型,词汇量约为 800 个单词。
我做了一些研究,一些商业语音引擎需要数千小时的语音记录来训练他们的声学模型:(nuance 和 google 花了 2000+ 和 1000+ 小时)。
因为我需要达到大约 95% 的准确率,语音语料库需要多少小时?
是不是语音语料越长,准确率就越高?