6

我正在尝试创建一个轻量级的双音素语音合成器。一切看起来都非常简单,因为我的母语有非常简单的发音和文本处理规则。我偶然发现的唯一问题是音高控制。

据我了解,为了控制语音的音高,大多数语音合成器都使用 LPC(线性预测编码),它基本上将音高信息与录制的语音样本分开,然后在合成过程中我可以提供自己的音高需要。

问题是我不是 DSP 专家。我使用了一个 Ooura FFT 库来提取 AFR 信息,我对使用 Hann 和 Hamming 窗口有所了解(我自己实现了 C++ 代码),但我大多将 DSP 算法视为黑匣子。

我希望找到一些开源库,它只是带有使用示例的裸 LPC 代码,但我找不到任何东西。大多数可用代码(如 Festival 引擎)都紧密集成到合成器中,分离它并学习如何使用它是一项非常艰巨的任务。

是否有任何 C/C++/C#/Java 开源 DSP 库带有“黑匣子”风格的 LPC 算法和使用示例,所以我可以只扔一个 PCM 样本数据并获得 LPC 编码输出,然后扔编码数据并合成解码后的语音数据?

4

1 回答 1

4

这不是您正在寻找的东西,但也许您会从这个非常复杂的工具箱中获得一些想法:Praat

于 2012-08-20T14:47:14.750 回答