问题标签 [kaldi]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
371 浏览

neural-network - 最佳开源语音识别 API 和引擎

我正在为 PC 制作我的语音识别项目(在 Windows 8 上工作)和该领域的新项目。该项目应具有基本功能,如在电子邮件、记事本等中准确听写,并应响应 PC 的本地命令。

我正在为我的语音识别项目使用 sphinx4。我想知道,有没有比 cmu sphinx 更好的开源 API?我希望在准确性和大词汇量方面做得更好。kaldi(基于深度神经网络)比 cmu sphinx(基于 HMM)更好吗?我想知道哪个更好?

语音 API 和语音引擎有什么区别,作为开发人员,我需要什么来开发我的软件?

请帮助我对上述问题给出一个清晰的认识,如果可能的话,请提供一些语音识别开发人员或研究人员社区链接。

0 投票
2 回答
3101 浏览

macos - 如何在 Mac 上设置 Kaldi?

kaldi的官方文档我翻过,很难理解。谁能给我推荐一个很好的教程,描述如何在 Mac 上运行 kaldi?

0 投票
0 回答
150 浏览

voice-recognition - 在 Kaldi 上获取用于语音识别的特征维度时出错?

我已经为语音识别做了“Kaldi for dummies”示例。但我收到以下错误。任何人都知道如何解决它?

为假人运行 Kaldi 时显示的错误消息

0 投票
2 回答
2223 浏览

google-colaboratory - 是否可以在 Google Colab 上安装 Kaldi

我想在使用 Kaldi ASR 的研究项目中使用 Google Colab。可以安装吗?以及安装后在哪里可以找到 Kaldi 文件?

0 投票
1 回答
461 浏览

linux - 使用 Cygwin 安装 Kaldi,zlib 错误

我正在尝试使用 cygwin 在 Windows 计算机上安装 kaldi。当我运行 ./tools/check_dependencies.sh (按照安装文件中的要求)时,我得到“zlib is not installed”,所以我转到 cygwin 包列表并尝试安装。问题是 - 没有“zlib”每个说看快照 有各种各样的包,但它们的执行名称不是“zlib”(除了一个不相关的),它总是一些东西-zlib-somthing。

因此,即使在安装它们之后,我最终也会收到相同的消息。check_dependencies.sh 中的代码是:

如果 !回声“#include”| $CXX -E ->&/dev/null; 然后 echo "$0: zlib is not installed." add_packages zlib-devel zlib1g-dev zlib-devel fi

我知道没有(相关的)方法可以直接使用 cygwin 安装 zlib - 所以这是一条死胡同。

无论如何,我试图让它工作但没有成功 - 非常感谢您的帮助。

0 投票
1 回答
157 浏览

speech-recognition - 如何在 kaldi 中使用“tri2a”和“tri2b_mmi”培训傻瓜教程?

我已经用我自己的自定义音频数据完成了Kaldi的傻瓜教程。在那个教程中,他们使用了Mono 对齐tri1训练方法。我可以将其更改为tri2a/tri2b_mmi培训吗?

0 投票
1 回答
497 浏览

c++ - sclite (SCTK) `make check` faliure, C++/perl/Cygwin, 安全使用 Perl4 的东西吗?

我目前正在尝试安装 NIST sclite,它是 SCTK 2.4.0(github更新版本)的一部分。我正在尝试Cygwinbash. 安装是使用make.

我已经通过了安装make configuremake all部分。这并非不费吹灰之力(请参阅关于第一个file not recognized)和第二个(模板/范围)问题的 SO 帖子)。当我进入make check安装部分时,许多检查/测试都通过了,但随后出现以下错误。

我已经做了一些研究(如下所述),并且我已经能够克服这个问题。但是,这涉及到包括一些过时perl的模块(Perl4)。

我的第一个问题是如何修复此错误或如何跳过该部分测试。我已经能够修复错误,如果人们认为它是安全的,我会将其作为答案。请注意,在解决make check此问题后还有一个问题,但我会在最后提到如何解决这个问题。

我想知道使用旧的 Perl ( Perl4::CoreLibs) 是否安全和/或良好的编程习惯。将源代码更改为使用 Perl5 的东西会更好吗?

有没有更好的方法?

我想确定的一件事是,没有进一步的关键测试make check可能会失败。


系统详情


我的尝试/研究

从上面的输出中,我们def_art.pl通过了检查,因为没有检查 - “ def_art.pl passed without tests”。然而,接下来的检查hubscr.pl,失败了。错误来自def_art.pl.

显而易见的事情似乎是运行def_art.pl,我做到了。

所以在我看来,这是一个不推荐使用的perl文件(或模块,或其他)。

我进一步挖掘并在 2014年的一次讨论中发现了这个讨论kaldi。(kaldi是一个使用 SCTK 评分系统的语音识别工具包)。我认为讨论中有 3 个部分特别相关,我将把它们链接起来(第一第二第三)。我将在这里插入零件:

def_art.pl正在寻找getopts.pl我在我的机器上找不到的东西!

... [T] 这些是 Perl 5 的最新版本不再支持的遗留包。我认为我们不应该接受对它们的依赖。自 Perl 5 开始以来,它们已被弃用。我们应该这样做而不是 'require "getopt.pl"' use Getopt::Std (注意:现代perl代码不应该require为系统包调用 "")。flush.plPerl 脚本中的“”也有类似的问题。我不知道 Perl 5 包的名称是什么。...有几个地方发生这种情况。

我终于发现两者getopts.plflush.pl可以从Perl4::CoreLibs. 我使用的 URLwget在此站点上被引用。显然,在其他*NIX发行版中,可以使用包管理器,例如

或者

但我找不到通过apt-cyg. 如我在做什么部分中所述,我能够从 tarball 安装它们。

再一次,我将陈述我的主要问题:这是安全/良好的编程习惯吗?有更好的解决方案吗?

如果有更好的解决方案(使用 Perl 5),似乎这个链接可能会引导它。


其他一些可能相关的链接:link_{n}link{n+1} about flush.pllink_{n+2} & link_{n+3} about getopts.pland Perl4::CoreLibs


我在做什么

我没有使用一次性命令行、环境变量添加的东西将此目录的lib子目录添加到环境变量中,而是执行了以下操作。PERLLIB

在目录中创建一个新目录/usr/lib,将文件移动到那里

最后,我通过将以下行添加到我的“此命令将路径添加到环境变量”中,使此目录成为perl每次使用终端时搜索路径的一部分。不同风格的 Linux 有不同的语法来添加环境变量,一定要找出你的语法!~/.bashrcPERLLIB

我为此运行的命令是

(感谢@melpomene 指出当前版本是 0.004,而不是 0.003。)

之后,我回到安装的基本文件夹并运行make cleanmake configmake allmake check.

这确实让我走得更远,make check但不是很远。

我想知道使用旧的 Perl (Perl4::CoreLibs) 是否安全和/或良好的编程习惯。将源代码更改为使用 Perl5 的东西会更好吗?

PS 毕竟,您可能想返回并删除您解压缩所有内容的文件夹。就我而言:


结果/后续步骤

一堆测试通过然后

也许会有所帮助。我将针对此问题发布一个单独的问题,或者,如果解决方案很快,我将在此帖子中添加解决方案。

0 投票
1 回答
621 浏览

neural-network - 使用 Kaldi 的 x 向量方法进行说话人分割

我将 kaldi 用于 asr,现在我想使用 Kaldi 的 x 向量方法进行说话人分割。他们在 https://github.com/kaldi-asr/kaldi/tree/master/egs/sre16/v2 提供了一些示例分割脚本他们还在https://david-ryan提供了 LDC 语料库的基本预训练模型-snyder.github.io/2017/10/04/model_sre16_v2.html

此预训练模型在未归档时具有以下结构:

在此处输入图像描述

我无法访问 LDC 语料库,我想知道如何根据自己的数据训练模型,然后如何使用该模型进行实际分割?

0 投票
0 回答
190 浏览

java - Android 上的 Kaldi - 无法解析“:app@debug/compileClasspath”的依赖关系:无法解析项目:speechutils:app。?

尝试使用 SpeechRecognition 技术,得到 Kaldi 的推荐,但没有找到仅基于此的 android Studio 项目。希望有人可以推荐一个 android studio 项目。


使用并且它没有 gradle 包装器?

同样在使用本地 gradle 发行版运行后,它会给出以下错误:

- 还有更多类似的错误。

我该如何解决这个问题?


注意 - 这似乎是基于讨论等,但事实并非如此,希望得到一些建设性的建议。


0 投票
1 回答
144 浏览

kaldi - 我的音频文件的转录在 7 秒后停止

我正在使用 Kaldi,但我遇到了一个问题,我的音频文件的转录在 7 秒后停止。kaldi 没有返回错误。为什么?

这是我的命令行:

这是我的音频文件: http ://www.wavsource.com/snds_2018-06-03_5106726768923853/tv/batman/ordinary.wav

谢谢 !