audio - 音频样本库（口语文本）

Question

对于我们目前正在进行的项目，我们需要一个包含多种不同语言的口语单词库。

两种选择似乎是可能的：文本转语音或母语人士的“真实”录音。由于质量对我们很重要，我们正在考虑走后一条路。

为了为我们的应用程序创建原型，我们正在寻找包含尽可能多不同语言的单词的库。为了感受我们方法的质量，这个库不应该由合成语音组成。

您知道任何可用/可访问的库吗？

score 3 · Accepted Answer

3

一位同事刚刚发现了这个基于社区的库，它很好，但体积很小：

Forvo.com

于 2008-09-27T11:13:20.697 回答

score 0 · Accepted Answer

我刚刚在 Audacity wiki 上找到了这个：VoxForge。从他们的网站：

VoxForge 的设置是为了收集转录的语音，以供免费和开源语音识别引擎（在 Linux、Windows 和 Mac 上）使用。

我们将在 GPL 许可下提供所有提交的音频文件，然后将它们“编译”成声学模型，用于 Sphinx、ISIP、Julius 和 HTK 等开源语音识别引擎（注意：HTK 有分发限制）。

score 0 · Accepted Answer

0

还有Old time radio，但不确定这是否是您想要的那种口语。

于 2008-09-27T11:56:30.780 回答

score 0 · Accepted Answer

我的猜测是，您在任何地方都找不到仅包含单个单词的库。无论您找到什么，您都必须在编辑器（如 Pro Tools 或 Cool Edit）中打开音频并将其分割成单个单词。

您最好为每种语言创建一个您需要的所有单词的列表，然后在录制时找到母语人士阅读它们。您可以让它们慢慢阅读，这样您就可以轻松地切碎每个单词。

score -1 · Accepted Answer

-1

我经常使用的一个：http: //shtooka.net/index.php 轻松访问录音。

于 2018-08-19T10:28:25.160 回答

audio - 音频样本库（口语文本）

5 回答 5

Related

Reference