问题标签 [kaldi]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
speech-to-text - 创建项目特定的 Vosk 字典
我正在开发一个使用 Vosk 进行语音识别的应用程序。我想为应用程序创建一个字典,其中仅包含应用程序所需的触发词和口语数字。使用此处找到的命令行说明:www.alphacephei.com/vosk/adaptation 我能够在我的笔记本电脑上安装 Kaldi。这些是,
但是,我在使用提供的命令构建字典时遇到问题。这些是,
问题出现在“cd model”,因为在 Kaldi 安装过程中创建的目录结构中没有 /model 目录。检查我的 Vosk 项目,我找到 /models,但也没有 /model 目录。
我尝试在 /kaldi/tools 中创建 /model ,然后运行上述命令但没有成功。请让我知道我在这里缺少什么。提前致谢。
c++ - pa_devs.c 检测到设备,但其他代码不检测
我目前正在尝试使以下代码工作,但是当尝试使用 portaudio 访问设备时,我使用 linux 计算机的功能,并且卡使用 ALSA。并且两个代码都使用相同版本的 portaudio
portaudio 提供了以下代码 pa_dev.c。此代码可以访问设备,并打印设备:
但是,当我从以下代码中调用函数 Pa_GetDeviceCount() 和 Pa_GetDeviceInfo() 时,portaudio 检测到 0 设备并给我消息“设备不可用”
有什么办法可以解决这个问题?
python - 无法在 ubuntu 18.04 上安装 pykaldi
我按照说明运行以下命令来安装 pykaldi:
当谈到最后一行时,我收到以下错误:
我还尝试了不同版本的 PyKaldi,即 1.8.0 和 1.10.0。但它显示了同样的错误。
编辑1:当我执行时/usr/bin/ninja -j 6
出现以下错误:ninja:错误:加载'build.ninja':没有这样的文件或目录
python - 无法在 Ubuntu 18.04 上使用 ninja-build
我正在尝试使用其文档安装 PyKaldi,并且我已经使用以下命令安装和配置了 ninja-build:
当我运行时,/usr/bin/ninja --version
我得到了正确的忍者版本:1.8.2
但是,当我执行时,出现/usr/bin/ninja -j 6
以下错误:
忍者:错误:加载'build.ninja':没有这样的文件或目录
忍者有什么问题?
shared-libraries - fstpushspecial:加载共享库时出错:fstpushspecial:不支持版本 0 的 Verneed 记录
我正在尝试运行 kaldi 配方,并在我的终端上收到以下错误。我已经提到了使用共享库发布的解决方案。但问题仍然没有解决。
请查看下面附加的错误截图以及我如何尝试和建议。 LD_RUN_PATH LD_LIBRARY_PATH
下面是我正在运行的 run.sh 文件的代码。
linux - 无法编译 .c,因为它找不到 .h 文件
我在 ubuntu 18.04 上,我正在尝试编译一个 .c 文件,该文件附带我正在使用的 API,称为vosk。问题是python代码没有任何问题但是如果我尝试
他们提供的用于运行 API 的 .c 文件给了我这个错误:
所以我尝试了make
与 test_vosk.c 文件位于同一目录中的 Makefile,但它给了我:
这是有道理的,因为目录 /usr/bin/ld 实际上并不存在于我的机器上。然后我尝试将 vosk_api.h 文件从它的目录(这是包含 test_vosk.c 的目录的父目录)移动到 test_vosk.c 文件的同一目录并更改
成一个
现在如果我再次编译
它给了我:
我已经坚持了好几天了,我真的不知道该去哪里,我对 linux 还是很陌生,因为我仍在学习基础知识,但如果有人可以帮助我,我将不胜感激。提前致谢!
c - 由于使用 vosk 的分段错误,无法运行 .c
我在 ubuntu 18.04 上,我正在尝试运行一个 .c 文件,该文件附带一个我只想运行的名为vosk的 API。问题是 python 脚本(API 附带的标准)没有任何问题,但是在使用它们提供make
的 .c 文件(称为test_vosk.c
)编译之后(所以我没有编写它)来运行 API:
并通过做来运行它
我收到此错误:
如果我尝试./test_vosk_speaker
(这基本上是相同的脚本但具有另一个功能)会发生类似的事情:
这个 API 与另一个名为Kaldi的库一起使用,例如来自./test_vosk_speaker
可能的错误提示与它相关的问题(这很奇怪,因为 python 工作!)。我仍在尝试学习 linux,但我真的不知道在哪里寻找这些东西,如果有人可以帮助我,那将非常有帮助。提前致谢!
如果它可以帮助编译的Makefiletest_vosk.c
里面是这样的
并且要运行的脚本需要将模型放在同一目录中的文件夹中,test_vosk.c
但是如果您不这样做并运行./test_vosk
它,它将找不到模型,这是出现的错误:
cygwin - 运行脚本 prepare_lang.sh 时出现 Kaldi 错误——GenericRegister::GetEntry: No such file or directory
我正在使用 Kaldi 在我自己的数据集上训练声学模型(遵循Eleanor Chodroff 的本教程)。我在 Windows 10 上使用 Cygwin。当我运行prepare_lang.sh
应该创建文件的脚本时/data/lang
,它会生成以下错误:
未创建这些文件:L.fst, L_disambig.fst, oov.int, oov.txt, topo
该命令的完整输出如下所示:
我从同一个教程中遵循了 Cygwin 的标准 Kaldi 安装,并kaldi/tools
拥有该文件夹openfst-1.7.2
。
我已经在谷歌上搜索了一段时间,但似乎找不到解决方案。我是 Kaldi 的新手,不确定错误的来源,所以我很乐意提供任何其他可能相关的细节。有人可以帮我吗?
installation - 未经管理员许可安装 gfortran
我想在服务器上安装 kaldi,当我运行 check_dependencies.sh 时,它告诉我应该安装 gfortran,但我不允许使用 sudo。
我试图从 anaconda 安装 gfortran,但它只显示 gfortran 在当前频道中不可用,即使我已经更新了我的 conda。
有没有替代方法?谢谢!!
gstreamer - 如何保存进入 Kaldi-Gstreamer 的音频流
我正在使用Kaldi-Gstreamer-server运行 Live ASR 。模型设置工作正常。但我想保存进入服务器的音频流。
通过浏览代码,很难理解。我想我必须修改worker.py来实现这一点,但不确定。
如果有人在这方面工作过,可以提供帮助。