-1

我试图想出一种将语音转换为文本的方法。我正在尝试使用Sphinx来实现这一点。我所说的无引导语音到文本的意思是,说话者不一定要从一组确定的句子中说话。相反,他可能会说任何句子。所以我不可能有一个语法文件,其中每个单词都是预先写在语法文件中的替代词之一。我知道我必须以某种方式训练狮身人面像才能做到这一点。

但我是狮身人面像的初学者。如何开始训练 Sphinx 以转换非引导语音?是否有可能使用 Sphinx 实现无引导的转换?

4

1 回答 1

0

你要做的任务是,到目前为止,还不可能完成,至少不能以令人满意的准确度完成。

至于基于 Sphinx 的解决方案:您必须创建包含所有要识别的单词的字典。没有其他办法。

一旦你有了字典,你就可以基于它生成一个简单的 n-gram 模型,只有 unigrams - 每个 unigram 将是一个单词。每个的概率可能相同,或者您可以尝试对将使用的单词进行一些统计分析。

于 2013-05-24T10:08:14.713 回答