问题标签 [mozilla-deepspeech]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 如何在Windows上安装Mozilla实现的百度深度语音?
我在 Windows 10 上,当我尝试安装Mozilla 的百度深度语音实现时,如下所示。
使用:
我收到此错误:“找不到满足 deepspeech 要求的版本(来自版本:)没有为 deepspeech 找到匹配的发行版”
有没有其他方法可以在 Windows 上安装它?
python - 无法在 Redhat 7 或 ubuntu 中安装 swig 和 swig 解码器
我已经通过以下方法安装了 swig 和 swig 解码器包:
痛饮:百胜安装痛饮
Swig 解码器:
克隆https://github.com/PaddlePaddle/DeepSpeech/
cd 进入解码器/swig/ 并运行 ./setup.sh
问题:当我在 python 中导入 swig 解码器库时,它显示以下错误:
php - 如何在 PHP Web 应用程序中实现 Mozilla DeepSpeech 以将语音转换为文本?
我有一个 PHP Web 应用程序,并且正在寻找一个开源的、高精度的语音到文本识别实现,它将接受语音命令来打开用户的网页。示例:“进行销售”(这将打开创建销售 PHP 页面)、“进行采购订单”、“打开 END-OF-DAY 报告”等。
我的问题:
我想知道我们是否可以使用Mozilla DeepSpeech从Firefox浏览器获取 .wav 音频并将语音返回为文本。如果是,那么使用麦克风从 Firefox 录制语音到使用 DeepSpeech 引擎转换文本的流程是什么?
如何进行类似于准备好监听命令的OK-GOOGLE的唤醒/启动呼叫?
linux - 如果使用用户标志安装,则找不到用于 deepspeech 的命令错误
我在 ubuntu 16.04 中使用
pip install deepspeech --user
但是当我在 cli 上使用 deepspeechdeepspeech -h
时,它说找不到命令。
我已经尝试过安装 pip 和 pip3 ,也尝试过重新启动,但它仍然说找不到命令。
python - Deepspeech - 推断更多音频文件并保存输出
我已经完成了来自 Mozilla 的 deepspeech 通用语音数据培训,现在我可以获得单个音频.wav
文件的输出。下面是我正在使用的命令。
在这里,myAudio_for_testing.wav 是我用来获取以下输出的音频文件。
heitor teay 我们决定午餐 ha annral 有限版 y ye com im standmat
这是我的几个问题,
1)上面加粗的句子是我的音频的输出。我怎样才能保存这个这么一些文件?
2)我有大约 2000 个这样的音频文件。如何逐个读取并获得输出?我试图在 python 中编写一个脚本来读取我拥有的所有 .wav 音频文件,但是由于我的 deepspeech 使用了一些保存在虚拟环境中的源,我不知道如何在脚本中编写 deepspeech 命令. 你们能给我一些提示吗?这将是一个很大的帮助。
谢谢:)
梅加
speech-recognition - Mozilla DeepSpeech 中的“时代测试 [数字]”是什么意思?
Mozilla DeepSpeech 中的“时代测试 [数字]”是什么意思?
在下面的例子中,它说Test of Epoch 77263
,即使根据我的理解应该只有 1 个 epoch,因为我给出了--display_step 1 --limit_train 1 --limit_dev 1 --limit_test 1 --early_stop False --epoch 1
参数:
speech-recognition - 将 --train_batch_size 2 增加到 --train_batch_size 3 会导致 Mozilla DeepSpeech 不再训练。为什么?
增加--train_batch_size 2
导致--train_batch_size 3
Mozilla DeepSpeech 不再训练。这有什么可以解释的?
具体来说,如果我运行
我得到set_name: train
:
但是,如果我运行:
我得到set_name: test
:
我使用 4 Nvidia GeForce GTX 1080 训练 Mozilla DeepSpeech。
mozilla-deepspeech - DeepSpeech:区分演讲者
我尝试将 DeepSpeech 用于呼叫中心,以口述和总结对话。
在这种情况下,总是有不止一个扬声器,通常是两个扬声器。在 DeepSpeech 识别对话时,有什么方法可以区分说话者吗?
谢谢你的建议。斤。
wav - deepspeech 训练音频文件长度
训练和推断音频文件长度是否必须等于 5 秒?我有这个问题是因为我有大量的音频训练数据(每个音频超过 30 秒)和相应的成绩单。如果我不能将这些数据用于训练,那么我需要对音频文件进行分块(我可以使用一些 python 脚本轻松完成),但我发现很难为各个分块的音频文件分块转录本。我现在是手动做的,但是有什么方法可以自动化吗?
有什么建议么?
谢谢:)
git - Bazel 构建不尊重我的 git 子模块
我正在一个bazel build
由 git 子模块组成的项目中运行,具有以下结构:
构建命令如下所示:
我收到以下错误:
似乎在抱怨这/work/train/DeepSpeech/.git
不是一个目录,这将是正确的,因为它/work/train/DeepSpeech/.git
是一个文件,包含 git 子模块的 git 树的路径。
以下是 的内容/work/train/DeepSpeech/.git
:
我的问题是:有没有办法让 bazel 尊重我的存储库的子模块结构?理想情况下,我可以在bazel build
命令中传递一些标志,使其神奇地工作,但我对其他选项持开放态度。
谢谢你的帮助!