对于我们目前正在进行的项目,我们需要一个包含多种不同语言的口语单词库。
两种选择似乎是可能的:文本转语音或母语人士的“真实”录音。由于质量对我们很重要,我们正在考虑走后一条路。
为了为我们的应用程序创建原型,我们正在寻找包含尽可能多不同语言的单词的库。为了感受我们方法的质量,这个库不应该由合成语音组成。
您知道任何可用/可访问的库吗?
对于我们目前正在进行的项目,我们需要一个包含多种不同语言的口语单词库。
两种选择似乎是可能的:文本转语音或母语人士的“真实”录音。由于质量对我们很重要,我们正在考虑走后一条路。
为了为我们的应用程序创建原型,我们正在寻找包含尽可能多不同语言的单词的库。为了感受我们方法的质量,这个库不应该由合成语音组成。
您知道任何可用/可访问的库吗?
一位同事刚刚发现了这个基于社区的库,它很好,但体积很小:
我刚刚在 Audacity wiki 上找到了这个:VoxForge。从他们的网站:
VoxForge 的设置是为了收集转录的语音,以供免费和开源语音识别引擎(在 Linux、Windows 和 Mac 上)使用。
我们将在 GPL 许可下提供所有提交的音频文件,然后将它们“编译”成声学模型,用于 Sphinx、ISIP、Julius 和 HTK 等开源语音识别引擎(注意:HTK 有分发限制)。
还有Old time radio,但不确定这是否是您想要的那种口语。
我的猜测是,您在任何地方都找不到仅包含单个单词的库。无论您找到什么,您都必须在编辑器(如 Pro Tools 或 Cool Edit)中打开音频并将其分割成单个单词。
您最好为每种语言创建一个您需要的所有单词的列表,然后在录制时找到母语人士阅读它们。您可以让它们慢慢阅读,这样您就可以轻松地切碎每个单词。
我经常使用的一个:http: //shtooka.net/index.php 轻松访问录音。