1

我正在 Raspbian 上试用 Jasper。根据Jasper 文档,除了 PocketSphinx,我们还必须安装 CMUCLMTK、MIT Language Modeling Toolkit、m2m-aligner、OpenFST 和 Phonetisaurus。

一旦我完成了 PocketSphinx 的安装,但安装所有这些依赖项之前,我曾经pocketsphinx_continuous测试过语音识别。不管准确性如何,它显然能够捕捉到我的演讲并完成了翻译过程。我什至使用 CMU 的lmtool创建了自己的文件.lm和文件,并毫无问题地尝试了它们。.dictpocketsphinx_continuous

我的问题是:PocketSphinx 似乎能够在没有所有这些依赖项的情况下执行语音识别。为什么 Jasper 告诉我安装它们?PocketSphinx 真的需要它们吗?它们服务于什么目的?

4

2 回答 2

2

在此列表中,至少不需要 2 个。CMUCLMTK 和 MITLM 都是具有相同功能的语言建模工具包。即使你想替换在线的lmtool,你也只需要其中一个。同样,Phonetisaurus 只需要 MITLM 和 m2m-aligner 来训练 g2p 模型,而不是使用它们。

所以理想情况下,您只希望 MITLM、OpenFST 和 phonetisaurus 替换在线 lmtool 并在本地添加新词。您不需要 CMUCLMTK 和 m2m-aligner。

将来,Pocketsphinx 将能够在没有 Phonetisaurus 的情况下处理新单词,因此您将能够放弃这种依赖。

如果 Jasper 开发人员仍然可以投诉,您需要向他们投诉。

于 2016-06-02T04:56:55.063 回答
2

CMUCLMTK、MITLM、m2m-aligner、OpenFST 和 Phonetisaurus 不是 PocketSphinx 依赖项,PocketSphinx 不需要。

Jasper 使用 CMUCLMTK 编译语言模型 (.lm)。

Phonetisaurus 依赖于 OpenFST Lib。

Jasper 使用 Phonetisaurus 来编译 Dictionary (.dict)。

Jasper 没有使用 MITLM 和 m2m-aligner。

从语料库编译 G2P(FST) 模型需要 MITLM、m2m-aligner(仅一次)和 OpenFST。

于 2016-06-02T05:00:18.137 回答