javascript - Webkit 语音识别 API：单音节

Question

我正在尝试使用 Webkit Speech Recognition API 来识别单个音节，而不是完整的单词或句子。由于这个API需要“语法”定义，不知道有没有办法实现单音节识别。像“啊”或“bi”之类的东西。

谢谢

score 1 · Accepted Answer

不幸的是，这对于 Web Speech API 是不可能的。尽管您可以创建自定义语法（它们是单词的集合），但您不能定义自定义词典或词汇表（它们是单词本身）。在您的情况下，您需要定义一个自定义词汇表，其中包含单个音素作为单词，然后将您的语法限制为仅从您的自定义词汇表中选择单词。有一些付费的基于云的服务可以让你做到这一点。

例如，使用 IBM Watson，您可以创建自定义语言模型，然后向模型中添加单词（在您的情况下，每个音素都是一个“单词”）。通常，自定义语言模型与通用语言模型混合，但您不希望这样，因此您将自定义权重设置为 1.0（这意味着它只会使用您的自定义语言模型）。

您也可以通过其他方式来解决它，但我怀疑您会找到一个不涉及付费服务的纯基于 Web 的解决方案。如果您能够迁移到本机平台（或在服务器上创建自己的基于 Web 的服务），那么您还有更多选择。例如，CMUSphinx 将允许您创建自定义字典以与服务器上的 Sphinx4 或移动设备上的 PocketSphinx 一起使用。尽管 CMUSphinx 不是用于大型词汇表应用程序的最准确系统，但您的自定义词汇表会很小，因此 CMUSphinx 会表现得非常好。

javascript - Webkit 语音识别 API：单音节

1 回答 1

Related

Reference