问题标签 [mozilla-deepspeech]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
2963 浏览

python - 如何在Windows上安装Mozilla实现的百度深度语音?

我在 Windows 10 上,当我尝试安装Mozilla 的百度深度语音实现时,如下所示。

使用:

我收到此错误:“找不到满足 deepspeech 要求的版本(来自版本:)没有为 deepspeech 找到匹配的发行版

有没有其他方法可以在 Windows 上安装它?

0 投票
0 回答
1376 浏览

python - 无法在 Redhat 7 或 ubuntu 中安装 swig 和 swig 解码器

我已经通过以下方法安装了 swig 和 swig 解码器包:

痛饮:百胜安装痛饮

Swig 解码器:

克隆https://github.com/PaddlePaddle/DeepSpeech/

cd 进入解码器/swig/ 并运行 ./setup.sh

问题:当我在 python 中导入 swig 解码器库时,它显示以下错误:

0 投票
2 回答
952 浏览

php - 如何在 PHP Web 应用程序中实现 Mozilla DeepSpeech 以将语音转换为文本?

我有一个 PHP Web 应用程序,并且正在寻找一个开源的、高精度的语音到文本识别实现,它将接受语音命令来打开用户的网页。示例:“进行销售”(这将打开创建销售 PHP 页面)、“进行采购订单”、“打开 END-OF-DAY 报告”等。

我的问题

我想知道我们是否可以使用Mozilla DeepSpeechFirefox浏览器获取 .wav 音频并将语音返回为文本。如果是,那么使用麦克风从 Firefox 录制语音到使用 DeepSpeech 引擎转换文本的流程是什么?

如何进行类似于准备好监听命令的OK-GOOGLE的唤醒/启动呼叫?

0 投票
2 回答
1739 浏览

linux - 如果使用用户标志安装,则找不到用于 deepspeech 的命令错误

我在 ubuntu 16.04 中使用

pip install deepspeech --user

但是当我在 cli 上使用 deepspeechdeepspeech -h时,它说找不到命令。

我已经尝试过安装 pip 和 pip3 ,也尝试过重新启动,但它仍然说找不到命令。

0 投票
3 回答
1525 浏览

python - Deepspeech - 推断更多音频文件并保存输出

我已经完成了来自 Mozilla 的 deepspeech 通用语音数据培训,现在我可以获得单个音频.wav文件的输出。下面是我正在使用的命令。

在这里,myAudio_for_testing.wav 是我用来获取以下输出的音频文件。

heitor teay 我们决定午餐 ha annral 有限版 y ye com im standmat

这是我的几个问题,

1)上面加粗的句子是我的音频的输出。我怎样才能保存这个这么一些文件?

2)我有大约 2000 个这样的音频文件。如何逐个读取并获得输出?我试图在 python 中编写一个脚本来读取我拥有的所有 .wav 音频文件,但是由于我的 deepspeech 使用了一些保存在虚拟环境中的源,我不知道如何在脚本中编写 deepspeech 命令. 你们能给我一些提示吗?这将是一个很大的帮助。

谢谢:)

梅加

0 投票
1 回答
565 浏览

speech-recognition - Mozilla DeepSpeech 中的“时代测试 [数字]”是什么意思?

Mozilla DeepSpeech 中的“时代测试 [数字]”是什么意思?

在下面的例子中,它说Test of Epoch 77263,即使根据我的理解应该只有 1 个 epoch,因为我给出了--display_step 1 --limit_train 1 --limit_dev 1 --limit_test 1 --early_stop False --epoch 1参数:

0 投票
1 回答
274 浏览

speech-recognition - 将 --train_batch_size 2 增加到 --train_batch_size 3 会导致 Mozilla DeepSpeech 不再训练。为什么?

增加--train_batch_size 2导致--train_batch_size 3Mozilla DeepSpeech 不再训练。这有什么可以解释的?


具体来说,如果我运行

我得到set_name: train

但是,如果我运行:

我得到set_name: test

我使用 4 Nvidia GeForce GTX 1080 训练 Mozilla DeepSpeech。

0 投票
0 回答
90 浏览

mozilla-deepspeech - DeepSpeech:区分演讲者

我尝试将 DeepSpeech 用于呼叫中心,以口述和总结对话。

在这种情况下,总是有不止一个扬声器,通常是两个扬声器。在 DeepSpeech 识别对话时,有什么方法可以区分说话者吗?

谢谢你的建议。斤。

0 投票
0 回答
408 浏览

wav - deepspeech 训练音频文件长度

训练和推断音频文件长度是否必须等于 5 秒?我有这个问题是因为我有大量的音频训练数据(每个音频超过 30 秒)和相应的成绩单。如果我不能将这些数据用于训练,那么我需要对音频文件进行分块(我可以使用一些 python 脚本轻松完成),但我发现很难为各个分块的音频文件分块转录本。我现在是手动做的,但是有什么方法可以自动化吗?

有什么建议么?

谢谢:)

0 投票
1 回答
1337 浏览

git - Bazel 构建不尊重我的 git 子模块

我正在一个bazel build由 git 子模块组成的项目中运行,具有以下结构:

构建命令如下所示:

我收到以下错误:

似乎在抱怨这/work/train/DeepSpeech/.git不是一个目录,这将是正确的,因为它/work/train/DeepSpeech/.git是一个文件,包含 git 子模块的 git 树的路径。

以下是 的内容/work/train/DeepSpeech/.git

我的问题是:有没有办法让 bazel 尊重我的存储库的子模块结构?理想情况下,我可以在bazel build命令中传递一些标志,使其神奇地工作,但我对其他选项持开放态度。

谢谢你的帮助!