1

我正在编写一个(离线)语音识别应用程序。我有 CMU Sphinx4 设置并使用一些包含的演示词典工作。但是,它们的范围有限(例如……数字、城市等)。

有没有更全面的语法可用?或者也许是更多这些有限语法的存储库?在创建自己的选项之前,我试图用尽所有其他选项。

谢谢

4

3 回答 3

2

语法总是特定于您的特定目标,因此分享这些语法是没有意义的。即使是像数字这样简单的主题也可能因具体应用而异:我们在常规语音中使用“零”和“哦”来表示“0”,而科学家也使用“不”来表示相同的目的。

Sphinx4 支持 JSGF 和 GRXML 格式,您可以轻松找到两者的规范。

于 2014-01-04T21:33:42.217 回答
0

您似乎将语法与字典弄错了。它们是完全不同的东西。

Sphinx 不仅支持语法,还支持 n-gram 语言模型。您可能会发现它们更加通用。这样的模型可以自动生成,并且如果给定一个反映真实用法的大型语料库,它将起作用。

至于字典 - 为英语创建它们相对简单。人们甚至可以考虑一种从在线词典中读取语音单词表示并将其转换为 sphinx 格式的工具。唯一的输入将是一个单词列表。

于 2014-01-13T08:26:14.473 回答
0

我相信这篇论文会对您的工作有所帮助。本文需要为一种新语言斯瓦希里语创建语法和字典

于 2014-01-26T13:53:46.533 回答