我正在做一个项目,我需要为我的应用程序创建一个自定义语音引擎。我见过类似 TTS Builder 的东西,但是有没有人了解 TTS Builder 等应用程序本身是如何开发的?SAPI 引擎背后的东西是什么?它们是如何工作的?一个人如何构建他/她自己的?我可以开发自己的算法吗?如果可能,我宁愿在 C# 中执行此操作
问问题
3982 次
1 回答
3
据我所知,TTS Builder 似乎采用了现有的声音,并允许您调整次要参数以制作听起来略有不同的声音。但我认为创建具有不同口音或发音的声音更复杂。
来自AT&T 研究:
创造高质量的声音需要优秀的声音人才、隔音室、专业的音频设备、数小时的书面材料以及语言中音素组合的全面覆盖,以及将这些录音转化为体面的合成声音的时间和专业知识。由于所涉及的费用,定制语音构建通常是为希望将现有演员的声音计算机化的公司完成的,例如为了延续品牌形象。
...
与从头开始构建 TTS 语音相比,构建转换模型所需的材料可能要少得多。
于 2011-04-23T04:13:39.063 回答