0

我有一个词/句子,有什么方法/开源包可以找到用户说出那个词/句子的概率

4

1 回答 1

2

最常用的免费语音识别工具包是:

  1. 卡尔迪
  2. CMU狮身人面像

使用 Python 使用pocketsphinx-python设置基本的语音识别系统非常简单。有点棘手,但根据我的经验,更好的结果是使用例如kaldi-gstreamer-server使用 Kaldi 设置系统。

另一种选择是使用如下 API:

  • 微软必应语音
  • 谷歌云语音
  • IBM 语音转文本

检查它们的一个很好的入口点是这个SpeechRecognition python 库。但是,请记住,对于这些服务,您将需要一个 API 密钥。

在你的情况下,你说你有一个给定的句子,并且想要得到这个句子被说出的概率。这与一般的语音识别任务略有不同,因为您有更多的先验信息可以使您的估计更准确。对于这个问题,常用的术语是关键字检测,您可以尝试将关键字列表与 CMU Sphinx 一起使用。

于 2019-03-23T08:27:05.223 回答