speech-recognition - 嵌入式应用的语音识别引擎

Question

我正在尝试研究可用的语音识别引擎和 SDK，以开发支持 Windows CE 语音的应用程序。我遇到过 Nuance，但没有看到太多其他东西。如果可能的话，我更喜欢 .Net SDK，但我想大多数都是 C/C++。我很感激任何建议。谢谢。

score 1 · Accepted Answer

Nuance 基本上已经把所有人都收买了。他们统治着语音市场，恐怕……

还有一些其他公司从事这项技术，但我不知道他们在嵌入式市场上的表现如何。有telisma和Loquendo，它们都有很强的非英语存在（而且他们的英语也不错）。

然后还有IBM。他们有ViaVoice Embedded。

业界正在等待的一件大事是看看微软收购TellMe会产生什么结果，但我认为他们可能会远离嵌入式市场，而不是将处理推向“云”，而这正是 TellMe 的所在需很长时间。

score 1 · Accepted Answer

我使用 IVR 应用程序；除了 Nuance，我们目前还在评估 Microsoft、IBM 和 Lumenvox。

大多数手机上包含的语音识别应用程序旨在将语音输入与先前说出的短语相匹配，例如将短语“Joe”分配给地址簿条目，并在您说“Joe”时让您的手机拨打该地址簿条目。更强大的语音识别引擎试图通过将短语分解为音素来破译自由形式的语音，然后与声学存储库进行匹配以试图找出实际所说的内容。一个成熟的语音识别引擎需要相当多的 CPU 马力；要在移动设备上进行任何复杂的语音识别，您可能需要将数据从设备发送到服务器进行处理。

score 0 · Accepted Answer

尝试查看 Microsoft 的语音 API， http: //msdn.microsoft.com/en-us/library/ms897381.aspx

我相信它可以在 CE 设备上运行。

score 0 · Accepted Answer

还有开源项目CMU Sphinx。他们有一个名为 PocketSphinx 的变体，专门针对便携式设备。

score 0 · Accepted Answer

正如我在上面的一条评论中所述，我们正在尝试 Vangard Voice Systems 的语音识别 .Net SDK。它使用 Nuance 的 Vocon3200 语音识别引擎，该引擎备受推崇，似乎在早期测试中运行良好。我们现在正在使用便宜的麦克风，并且在外部噪音方面存在一些问题。希望通过降噪耳机解决这个问题。该软件模型有点缺乏，它基本上与现有的非语音应用程序挂钩。由于这一事实，存在一些限制，并且开发人员可以访问的 API 有限。任何时候你试图过度简化这样的事情，你都会让制定一个强大的解决方案变得更加困难。话虽如此，我们确实找不到任何竞争产品可以满足我们对移动应用程序语音支持的 .Net SDK 需求。

我更愿意使用 Nuance 的 C++ SDK（另一家公司已经为此编写了 .Net 包装器），但 Nuance 商业模式假设我们正在开发一种用于转售的产品，并且涉及到一些重要的版税。对于想要开发内部应用程序的公司来说，这是一个真正的障碍。

speech-recognition - 嵌入式应用的语音识别引擎

5 回答 5

Related

Reference