我使用了一个名为 Festival 的开源程序,它生成文本到语音,在 ubuntu 中我调用它的方法 text2wave 将文本转换为波形文件。我正在考虑将短段落转换为波形文件,但问题是每个波形文件最终大小约为 1.2MB。波形文件以 16khz 录制,而以 8khz 录制时波形文件的大小减半(牺牲音质),波形文件太大了。这些段落必须多次提供给客户端,而我们的服务器无法支持那么多带宽。
有谁知道如何绕过这个问题?是否可以在服务器上压缩文件,并在我的 Flash 脚本(在客户端)中解压缩并播放波形?我会节省多少尺寸?谢谢你的帮助。