问题标签 [kaldi]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
neural-network - 最佳开源语音识别 API 和引擎
我正在为 PC 制作我的语音识别项目(在 Windows 8 上工作)和该领域的新项目。该项目应具有基本功能,如在电子邮件、记事本等中准确听写,并应响应 PC 的本地命令。
我正在为我的语音识别项目使用 sphinx4。我想知道,有没有比 cmu sphinx 更好的开源 API?我希望在准确性和大词汇量方面做得更好。kaldi(基于深度神经网络)比 cmu sphinx(基于 HMM)更好吗?我想知道哪个更好?
语音 API 和语音引擎有什么区别,作为开发人员,我需要什么来开发我的软件?
请帮助我对上述问题给出一个清晰的认识,如果可能的话,请提供一些语音识别开发人员或研究人员社区链接。
macos - 如何在 Mac 上设置 Kaldi?
kaldi的官方文档我翻过,很难理解。谁能给我推荐一个很好的教程,描述如何在 Mac 上运行 kaldi?
voice-recognition - 在 Kaldi 上获取用于语音识别的特征维度时出错?
我已经为语音识别做了“Kaldi for dummies”示例。但我收到以下错误。任何人都知道如何解决它?
google-colaboratory - 是否可以在 Google Colab 上安装 Kaldi
我想在使用 Kaldi ASR 的研究项目中使用 Google Colab。可以安装吗?以及安装后在哪里可以找到 Kaldi 文件?
linux - 使用 Cygwin 安装 Kaldi,zlib 错误
我正在尝试使用 cygwin 在 Windows 计算机上安装 kaldi。当我运行 ./tools/check_dependencies.sh (按照安装文件中的要求)时,我得到“zlib is not installed”,所以我转到 cygwin 包列表并尝试安装。问题是 - 没有“zlib”每个说看快照 有各种各样的包,但它们的执行名称不是“zlib”(除了一个不相关的),它总是一些东西-zlib-somthing。
因此,即使在安装它们之后,我最终也会收到相同的消息。check_dependencies.sh 中的代码是:
如果 !回声“#include”| $CXX -E ->&/dev/null; 然后 echo "$0: zlib is not installed." add_packages zlib-devel zlib1g-dev zlib-devel fi
我知道没有(相关的)方法可以直接使用 cygwin 安装 zlib - 所以这是一条死胡同。
无论如何,我试图让它工作但没有成功 - 非常感谢您的帮助。
speech-recognition - 如何在 kaldi 中使用“tri2a”和“tri2b_mmi”培训傻瓜教程?
我已经用我自己的自定义音频数据完成了Kaldi的傻瓜教程。在那个教程中,他们使用了Mono 对齐和tri1训练方法。我可以将其更改为tri2a/tri2b_mmi培训吗?
c++ - sclite (SCTK) `make check` faliure, C++/perl/Cygwin, 安全使用 Perl4 的东西吗?
我目前正在尝试安装 NIST sclite
,它是 SCTK 2.4.0(github或更新版本)的一部分。我正在尝试Cygwin
在bash
. 安装是使用make
.
我已经通过了安装make configure
的make all
部分。这并非不费吹灰之力(请参阅关于第一个(file not recognized
)和第二个(模板/范围)问题的 SO 帖子)。当我进入make check
安装部分时,许多检查/测试都通过了,但随后出现以下错误。
我已经做了一些研究(如下所述),并且我已经能够克服这个问题。但是,这涉及到包括一些过时perl
的模块(Perl4)。
我的第一个问题是如何修复此错误或如何跳过该部分测试。我已经能够修复错误,如果人们认为它是安全的,我会将其作为答案。请注意,在解决make check
此问题后还有一个问题,但我会在最后提到如何解决这个问题。
我想知道使用旧的 Perl ( Perl4::CoreLibs
) 是否安全和/或良好的编程习惯。将源代码更改为使用 Perl5 的东西会更好吗?
有没有更好的方法?
我想确定的一件事是,没有进一步的关键测试make check
可能会失败。
系统详情
我的尝试/研究
从上面的输出中,我们def_art.pl
通过了检查,因为没有检查 - “ def_art.pl passed without tests
”。然而,接下来的检查hubscr.pl
,失败了。错误来自def_art.pl
.
显而易见的事情似乎是运行def_art.pl
,我做到了。
所以在我看来,这是一个不推荐使用的perl
文件(或模块,或其他)。
我进一步挖掘并在 2014年的一次讨论中发现了这个讨论kaldi
。(kaldi
是一个使用 SCTK 评分系统的语音识别工具包)。我认为讨论中有 3 个部分特别相关,我将把它们链接起来(第一、第二、第三)。我将在这里插入零件:
def_art.pl
正在寻找getopts.pl
我在我的机器上找不到的东西!... [T] 这些是 Perl 5 的最新版本不再支持的遗留包。我认为我们不应该接受对它们的依赖。自 Perl 5 开始以来,它们已被弃用。我们应该这样做而不是 'require "getopt.pl"'
use Getopt::Std
(注意:现代perl
代码不应该require
为系统包调用 "")。flush.pl
Perl 脚本中的“”也有类似的问题。我不知道 Perl 5 包的名称是什么。...有几个地方发生这种情况。
我终于发现两者getopts.pl
都flush.pl
可以从Perl4::CoreLibs
. 我使用的 URLwget
在此站点上被引用。显然,在其他*NIX
发行版中,可以使用包管理器,例如
或者
但我找不到通过apt-cyg
. 如我在做什么部分中所述,我能够从 tarball 安装它们。
再一次,我将陈述我的主要问题:这是安全/良好的编程习惯吗?有更好的解决方案吗?
如果有更好的解决方案(使用 Perl 5),似乎这个链接可能会引导它。
其他一些可能相关的链接:link_{n}和link{n+1} about flush.pl
,link_{n+2} & link_{n+3} about getopts.pl
and Perl4::CoreLibs
。
我在做什么
我没有使用一次性命令行、环境变量添加的东西将此目录的lib
子目录添加到环境变量中,而是执行了以下操作。PERLLIB
在目录中创建一个新目录/usr/lib
,将文件移动到那里
最后,我通过将以下行添加到我的“此命令将路径添加到环境变量”中,使此目录成为perl
每次使用终端时搜索路径的一部分。不同风格的 Linux 有不同的语法来添加环境变量,一定要找出你的语法!~/.bashrc
PERLLIB
我为此运行的命令是
(感谢@melpomene 指出当前版本是 0.004,而不是 0.003。)
之后,我回到安装的基本文件夹并运行make clean
、make config
、make all
和make check
.
这确实让我走得更远,make check
但不是很远。
我想知道使用旧的 Perl (Perl4::CoreLibs) 是否安全和/或良好的编程习惯。将源代码更改为使用 Perl5 的东西会更好吗?
PS 毕竟,您可能想返回并删除您解压缩所有内容的文件夹。就我而言:
结果/后续步骤
一堆测试通过然后
neural-network - 使用 Kaldi 的 x 向量方法进行说话人分割
我将 kaldi 用于 asr,现在我想使用 Kaldi 的 x 向量方法进行说话人分割。他们在 https://github.com/kaldi-asr/kaldi/tree/master/egs/sre16/v2 提供了一些示例分割脚本。他们还在https://david-ryan提供了 LDC 语料库的基本预训练模型-snyder.github.io/2017/10/04/model_sre16_v2.html
此预训练模型在未归档时具有以下结构:
我无法访问 LDC 语料库,我想知道如何根据自己的数据训练模型,然后如何使用该模型进行实际分割?
java - Android 上的 Kaldi - 无法解析“:app@debug/compileClasspath”的依赖关系:无法解析项目:speechutils:app。?
尝试使用 SpeechRecognition 技术,得到 Kaldi 的推荐,但没有找到仅基于此的 android Studio 项目。希望有人可以推荐一个 android studio 项目。
使用它并且它没有 gradle 包装器?
同样在使用本地 gradle 发行版运行后,它会给出以下错误:
- 还有更多类似的错误。
我该如何解决这个问题?
注意 - 这似乎是基于讨论等,但事实并非如此,希望得到一些建设性的建议。
kaldi - 我的音频文件的转录在 7 秒后停止
我正在使用 Kaldi,但我遇到了一个问题,我的音频文件的转录在 7 秒后停止。kaldi 没有返回错误。为什么?
这是我的命令行:
这是我的音频文件: http ://www.wavsource.com/snds_2018-06-03_5106726768923853/tv/batman/ordinary.wav
谢谢 !