我正在为我自己的 Java 语言开发文本到语音转换 (TTS)(它是一个以前没有开发过的最终项目,因此我不能使用内置类)。
我可以识别输入文本的双音素。
为了演奏,我在输入文本分析完成后将双音素放在一个数组中。之后,我根据数组中的双音素(一个接一个)播放音频文件(ogg 格式)。
我想问的是,您对这种单独演奏双音素的方法有何看法?现在我在播放我试图平滑的每个音频剪辑之间有(很大的)差距。有任何想法吗?
我正在为我自己的 Java 语言开发文本到语音转换 (TTS)(它是一个以前没有开发过的最终项目,因此我不能使用内置类)。
我可以识别输入文本的双音素。
为了演奏,我在输入文本分析完成后将双音素放在一个数组中。之后,我根据数组中的双音素(一个接一个)播放音频文件(ogg 格式)。
我想问的是,您对这种单独演奏双音素的方法有何看法?现在我在播放我试图平滑的每个音频剪辑之间有(很大的)差距。有任何想法吗?