c++ - Linux中的语音到文本转换

Question

我打算在 Linux 中启动一个将语音转换为文本的应用程序。是否有任何现有接口以便我可以扩展它们？或者Linux中是否有任何这样的现有应用程序？对此有任何意见吗？

编辑：我计划编写的应用程序应该能够将我们所说的每个单词转换为文本，而不仅仅是是/否。

score 8 · Accepted Answer

嗯，这是一项艰巨的任务，不用说你想使用什么技术，这里有一些链接：

祝你好运。有了更多的细节，我们或许能够提供更好的答案。例如，“是/否”呼叫中心式识别与部分自然语言理解之间存在很大差异。

score 3 · Accepted Answer

戴夫的建议是一个很好的开始。斯芬克斯非常漂亮。

我只想补充一点，你应该尽可能地概率。作为一名一次性语言学家，甚至更早的一次性音韵学爱好者，我可以自信地说不要被语言模型所困扰。让我们不要忘记经常被错误归因的“每次我解雇语言学家，我的准确性都会提高”。这实际上是关于模型及其解释噪音和变化的能力，而不是麻省理工学院文科专业必须说的任何东西。

一本好书是 Jurafsky 和 Martin 的“语音和语言处理”。它对任务的计算模型有一些非常有用的应用。Harvey Sussman 对各种元音的 F2 斜率中的线性相关的研究（从谷仓猫头鹰开始，一直向人类发展）似乎在当今的模型中实现是一件好事。

score 3 · Accepted Answer

3

Julius也是 Linux 的不错选择

于 2009-11-03T05:12:56.357 回答

score 1 · Accepted Answer

Sphinx 是您在 Linux 上的最佳选择。我已经尝试过 Sphinx II 和 Sphinx III。有一些可用的开源语言和声学模型可以与它们中的每一个一起使用。根本不是生产级别的性能，但足以用于原型设计或演示。对于生产，您需要开发自己的语言和声学模型。

4 回答 4