Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
虽然我最初在使 sphinx 4 工作时遇到了一些问题,但现在它工作得很好。由于语法是有限的,无论是 JSGF 还是 N-Gram,我无法让 sphinx 识别每一个可能的单词或句子。我想构建类似基于语音的谷歌搜索。由于搜索可能有任何可能的单词或单词组合。在语法中添加所有字典单词很麻烦。请帮忙。
不,这是不可能的。每个语音识别器,包括来自 Google 的语音识别器都使用有限的词汇量。谷歌使用了大约 150 万个单词中的一个,但仍然有限。所以CMUSphinx。您可以通过尝试识别罕见的专有名称来验证这一点,即使使用 Google 也几乎是不可能的。
实际的解决方案是使用大词汇量的大语言模型。
检测音频流中的新词并将其添加到语音或其他类型反馈的识别器是一个开放的研究问题。