0

我想做一点应用,有人知道带有sdk的良好的说话者相关语音识别引擎吗?(不是语音到文本引擎)

谢谢你,

埃弗拉特

4

4 回答 4

1

我使用 sphinx-4 达到了 82.25% 的准确率。我正在研究如何将其提高到 95% 以上。我只转录一个人的声音,所以如果依赖扬声器的系统会有所帮助,那就太好了。词汇量约为 40,000 个单词。我有一个双核系统,我可以轻松运行 sphinx-train 和 sphinx4 解码器,尽管培训师需要一天的时间来训练我拥有的 40 小时的音频并且解码器是实时的。

我想知道是否有一个产品/开源库可以用来提高我的准确率。

谢谢,陀罗尼

于 2010-03-01T11:23:44.537 回答
1

Sphinx可能与您正在寻找的内容相符。这是一个开源语音识别平台,也是卡内基梅隆大学正在进行的项目。

于 2010-01-18T22:51:47.510 回答
0

有扬声器相关的引擎,它们更原始,就像手机一样。不要尝试转换为文本,它们只是进行信号比较。这就是我所需要的。

于 2010-01-19T07:55:22.533 回答
0

请详细说明。什么平台?多大的词汇量?有什么性能限制?连续的?半连续?“不是文本引擎的语音”是什么意思?

如果您需要一些简单而小的东西,您可能想尝试用 C 编写的EARS,而且不是很大,可能对初学者有好处。

于 2010-01-18T22:51:39.143 回答