-1

对于我们目前正在进行的项目,我们需要一个包含多种不同语言的口语单词库。

两种选择似乎是可能的:文本转语音或母语人士的“真实”录音。由于质量对我们很重要,我们正在考虑走后一条路。

为了为我们的应用程序创建原型,我们正在寻找包含尽可能多不同语言的单词的库。为了感受我们方法的质量,这个库不应该由合成语音组成。

您知道任何可用/可访问的库吗?

4

5 回答 5

3

一位同事刚刚发现了这个基于社区的库,它很好,但体积很小:

Forvo.com

于 2008-09-27T11:13:20.697 回答
0

我刚刚在 Audacity wiki 上找到了这个:VoxForge。从他们的网站:

VoxForge 的设置是为了收集转录的语音,以供免费和开源语音识别引擎(在 Linux、Windows 和 Mac 上)使用。

我们将在 GPL 许可下提供所有提交的音频文件,然后将它们“编译”成声学模型,用于 Sphinx、ISIP、Julius 和 HTK 等开源语音识别引擎(注意:HTK 有分发限制)。

于 2008-09-27T11:42:12.047 回答
0

还有Old time radio,但不确定这是否是您想要的那种口语。

于 2008-09-27T11:56:30.780 回答
0

我的猜测是,您在任何地方都找不到仅包含单个单词的库。无论您找到什么,您都必须在编辑器(如 Pro Tools 或 Cool Edit)中打开音频并将其分割成单个单词。

您最好为每种语言创建一个您需要的所有单词的列表,然后在录制时找到母语人士阅读它们。您可以让它们慢慢阅读,这样您就可以轻松地切碎每个单词。

于 2008-09-27T12:28:32.717 回答
-1

我经常使用的一个:http: //shtooka.net/index.php 轻松访问录音。

于 2018-08-19T10:28:25.160 回答