speech-recognition - 使用 sdk 的说话人相关语音识别引擎

Question

我想做一点应用，有人知道带有sdk的良好的说话者相关语音识别引擎吗？（不是语音到文本引擎）

谢谢你，

埃弗拉特

score 1 · Accepted Answer

我使用 sphinx-4 达到了 82.25% 的准确率。我正在研究如何将其提高到 95% 以上。我只转录一个人的声音，所以如果依赖扬声器的系统会有所帮助，那就太好了。词汇量约为 40,000 个单词。我有一个双核系统，我可以轻松运行 sphinx-train 和 sphinx4 解码器，尽管培训师需要一天的时间来训练我拥有的 40 小时的音频并且解码器是实时的。

我想知道是否有一个产品/开源库可以用来提高我的准确率。

谢谢，陀罗尼

score 1 · Accepted Answer

Sphinx可能与您正在寻找的内容相符。这是一个开源语音识别平台，也是卡内基梅隆大学正在进行的项目。

score 0 · Accepted Answer

有扬声器相关的引擎，它们更原始，就像手机一样。不要尝试转换为文本，它们只是进行信号比较。这就是我所需要的。

score 0 · Accepted Answer

请详细说明。什么平台？多大的词汇量？有什么性能限制？连续的？半连续？“不是文本引擎的语音”是什么意思？

如果您需要一些简单而小的东西，您可能想尝试用 C 编写的EARS，而且不是很大，可能对初学者有好处。

speech-recognition - 使用 sdk 的说话人相关语音识别引擎

4 回答 4

Related

Reference