是否有任何使用录制的语音数据生成合成语音的开源、开放内容项目?(目标是合成/模拟特定个人的语音。作为旁注,这个过程、目标或提取的数据是否有名称?“语音签名”?)
我想工作流程会是这样的:
- 从标准化文本中录制语音(“泰迪熊坐在垫子上。”)
- 挑选音素(猫的“a”),解释口音
- 获取使 Alice 的“eh”听起来与 Betty 的“eh”不同的数据
- 使用适合口音的音素和语音签名将文本转换为语音
回答这个问题是请求Jack Angel(泰迪、Wonkers)为了人类而将他舒缓的声音签名捐赠给公共领域的关键一步。