问题标签 [vosk]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
node.js - Electron 无法从 node_modules 文件夹打开共享对象文件
在 electron 上,节点模块vosk
需要访问一些位于node_modules/vosk/lib/
.
我现在遇到的问题是,当我这样做require('vosk')
并main.js
尝试执行我的 AppImage 文件时,我得到:
我尝试将 vosk 添加到构建中的文件中:
我现在可以看到文件app.asar.unpacked/node_modules/vosk/lib/
夹中的文件,但是在执行应用程序时,我仍然遇到同样的错误。
我发现这个答案提到了一个黑客,但它没有解决我的问题,我仍然有完全相同的错误。
我应该如何以vosk
可以找到它们的方式打包共享对象?
timer - 使用 KaldiRecognizer.java 类时如何增加默认的最小输入时间限制?
我已经在一个应用程序中实现了 VOSK,基于android demo。目前,在收听输入时,麦克风会保持打开状态 5 秒钟,然后评估输入。我需要麦克风保持打开更长时间,即 10 秒。以下暂定对其没有影响。
帮助 :(
nlp - Vosk 扬声器识别
我目前正在将 Vosk 语音识别实施到应用程序中。具体来看说话人识别,我已经从示例中实现了 test_speaker.py 并且它是功能性的。作为新手,我如何识别和/或创建参考说话人签名?使用提供的那个,用我的音频示例计算的距离列表并没有描述所涉及的两个扬声器:
如果没有一种有效的方法可以从正在分析的音频中计算参考扬声器,您是否知道可以与 Vosk 一起使用来识别音频文件中的扬声器的另一种解决方案?如果没有,您会建议其他什么语音转文本选项?(我已经玩过谷歌的)
提前致谢
android - Gradle 错误 - 没有方法签名适用于参数类型值
我正在尝试将 Vosk 集成到我的项目中。我需要修改 vosk 代码,所以理想情况下我需要引用模块本身。
这是我正在处理的提交 - 集成 vosk - vosktest 分支
https://github.com/dewijones92/VoskIntegrate/commit/d6e1c75ee6ddba4d66c79f6bd641d90b53c7ff2b
的代码/home/dewi/code/vosk-api/android/lib
是https://github.com/alphacep/vosk-api/tree/ e6bd200c856346ff745d77eafc75d63528398833/android
我没有运气建立这个项目。这是我收到的错误消息:
任何想法?非常感谢
speech-to-text - 创建项目特定的 Vosk 字典
我正在开发一个使用 Vosk 进行语音识别的应用程序。我想为应用程序创建一个字典,其中仅包含应用程序所需的触发词和口语数字。使用此处找到的命令行说明:www.alphacephei.com/vosk/adaptation 我能够在我的笔记本电脑上安装 Kaldi。这些是,
但是,我在使用提供的命令构建字典时遇到问题。这些是,
问题出现在“cd model”,因为在 Kaldi 安装过程中创建的目录结构中没有 /model 目录。检查我的 Vosk 项目,我找到 /models,但也没有 /model 目录。
我尝试在 /kaldi/tools 中创建 /model ,然后运行上述命令但没有成功。请让我知道我在这里缺少什么。提前致谢。
command-line - 从命令行 / crontab / autostart / Vosk 启动的程序
我遇到了以下问题:我用 vosk 编写了一个语音识别程序,现在想通过使用 crontab 重新启动来自动启动这个程序。因此,该程序应该以 .sh 文件开头。
程序是用 thonny (IDE) 编写的,工作得很好,但是一旦我想从命令行启动它,就会出现以下错误:
有人可以解释一下命令行和 IDE 之间的区别吗?或者给我一个自动启动的替代解决方案?非常感谢提前
openfst - “错误:fstsymbols:保存符号但没有输出符号”是什么意思,我该如何解决?
我想更新 Vosk 中使用的 Kaldi 模型的语言模型。我正在关注更新Vosk Adaptation中的语言模型
我有这个错误:fstsymbols: Saving osymbols but there are no output symbols when I try to run fstsymbols --save_osymbols=words.txt Gr.fst > /dev/null
。我猜 words.txt 是我想识别的新文本,对吧?
python - 使用 vosk api 和 PyInstaller 编译文件
我尝试使用 vosk 库从 python 文件编译 exe 文件。编译没问题。每次我尝试运行 exe 时都会出现此错误:
我应该怎么办?
python - 如何在 VOSK 语音识别中使用 Wave 文件作为输入?
我有一个项目需要获取记录的文件,然后通过代码处理并从文件中提取文本并将提取的文件与其他文本匹配并验证它。我的问题是:我不能在代码中使用记录的文件并且它不读取文件
init 函数是代码的基础。
验证功能确认匹配的语音和文本。
python - 如何多线程一个程序并将结果返回给 main.py?
我正在使用 Windows 和 python。目标很简单,运行main.py
启动语音识别,一旦识别出所说的内容,就会将文本返回到main.py
. 语音识别程序可以毫无问题地识别,问题在于多线程并将结果返回到main.py
.
这是main.py:
这是语音识别,称为新线程: