问题标签 [mozilla-deepspeech]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

92 问题

0 投票

1 回答

2963 浏览

python - 如何在Windows上安装Mozilla实现的百度深度语音？

我在 Windows 10 上，当我尝试安装Mozilla 的百度深度语音实现时，如下所示。

使用：

我收到此错误：“找不到满足 deepspeech 要求的版本（来自版本：）没有为 deepspeech 找到匹配的发行版”

有没有其他方法可以在 Windows 上安装它？

2017-11-26T23:45:40.157

0 投票

0 回答

1376 浏览

python - 无法在 Redhat 7 或 ubuntu 中安装 swig 和 swig 解码器

我已经通过以下方法安装了 swig 和 swig 解码器包：

痛饮：百胜安装痛饮

Swig 解码器：

克隆https://github.com/PaddlePaddle/DeepSpeech/

cd 进入解码器/swig/ 并运行 ./setup.sh

问题：当我在 python 中导入 swig 解码器库时，它显示以下错误：

python redhat swig paddle-paddle mozilla-deepspeech

2018-04-16T13:15:59.613

0 投票

2 回答

952 浏览

php - 如何在 PHP Web 应用程序中实现 Mozilla DeepSpeech 以将语音转换为文本？

我有一个 PHP Web 应用程序，并且正在寻找一个开源的、高精度的语音到文本识别实现，它将接受语音命令来打开用户的网页。示例：“进行销售”（这将打开创建销售 PHP 页面）、“进行采购订单”、“打开 END-OF-DAY 报告”等。

我的问题：

我想知道我们是否可以使用Mozilla DeepSpeech从Firefox浏览器获取 .wav 音频并将语音返回为文本。如果是，那么使用麦克风从 Firefox 录制语音到使用 DeepSpeech 引擎转换文本的流程是什么？

如何进行类似于准备好监听命令的OK-GOOGLE的唤醒/启动呼叫？

php speech-recognition speech-to-text webspeech-api mozilla-deepspeech

2018-05-29T10:56:40.163

0 投票

2 回答

1739 浏览

linux - 如果使用用户标志安装，则找不到用于 deepspeech 的命令错误

我在 ubuntu 16.04 中使用

pip install deepspeech --user

但是当我在 cli 上使用 deepspeechdeepspeech -h时，它说找不到命令。

我已经尝试过安装 pip 和 pip3 ，也尝试过重新启动，但它仍然说找不到命令。

linux nlp ubuntu-16.04 mozilla-deepspeech

2018-06-06T04:39:31.933

0 投票

3 回答

1525 浏览

python - Deepspeech - 推断更多音频文件并保存输出

我已经完成了来自 Mozilla 的 deepspeech 通用语音数据培训，现在我可以获得单个音频.wav文件的输出。下面是我正在使用的命令。

在这里，myAudio_for_testing.wav 是我用来获取以下输出的音频文件。

heitor teay 我们决定午餐 ha annral 有限版 y ye com im standmat

这是我的几个问题，

1）上面加粗的句子是我的音频的输出。我怎样才能保存这个这么一些文件？

2）我有大约 2000 个这样的音频文件。如何逐个读取并获得输出？我试图在 python 中编写一个脚本来读取我拥有的所有 .wav 音频文件，但是由于我的 deepspeech 使用了一些保存在虚拟环境中的源，我不知道如何在脚本中编写 deepspeech 命令. 你们能给我一些提示吗？这将是一个很大的帮助。

谢谢：）

梅加

python command-line output mozilla-deepspeech

2018-06-29T13:16:40.683

0 投票

1 回答

565 浏览

speech-recognition - Mozilla DeepSpeech 中的“时代测试 [数字]”是什么意思？

Mozilla DeepSpeech 中的“时代测试 [数字]”是什么意思？

在下面的例子中，它说Test of Epoch 77263，即使根据我的理解应该只有 1 个 epoch，因为我给出了--display_step 1 --limit_train 1 --limit_dev 1 --limit_test 1 --early_stop False --epoch 1参数：

speech-recognition mozilla-deepspeech

2018-06-30T19:28:58.000

0 投票

1 回答

274 浏览

speech-recognition - 将 --train_batch_size 2 增加到 --train_batch_size 3 会导致 Mozilla DeepSpeech 不再训练。为什么？

增加--train_batch_size 2导致--train_batch_size 3Mozilla DeepSpeech 不再训练。这有什么可以解释的？

具体来说，如果我运行

我得到set_name: train：

但是，如果我运行：

我得到set_name: test：

我使用 4 Nvidia GeForce GTX 1080 训练 Mozilla DeepSpeech。

speech-recognition mozilla-deepspeech

2018-07-01T18:58:50.423

0 投票

0 回答

90 浏览

mozilla-deepspeech - DeepSpeech：区分演讲者

我尝试将 DeepSpeech 用于呼叫中心，以口述和总结对话。

在这种情况下，总是有不止一个扬声器，通常是两个扬声器。在 DeepSpeech 识别对话时，有什么方法可以区分说话者吗？

谢谢你的建议。斤。

mozilla-deepspeech

2018-07-30T05:36:31.930

0 投票

0 回答

408 浏览

wav - deepspeech 训练音频文件长度

训练和推断音频文件长度是否必须等于 5 秒？我有这个问题是因为我有大量的音频训练数据（每个音频超过 30 秒）和相应的成绩单。如果我不能将这些数据用于训练，那么我需要对音频文件进行分块（我可以使用一些 python 脚本轻松完成），但我发现很难为各个分块的音频文件分块转录本。我现在是手动做的，但是有什么方法可以自动化吗？

有什么建议么？

谢谢：）

wav transcription mozilla-deepspeech

2018-08-02T10:25:35.920

0 投票

1 回答

1337 浏览

git - Bazel 构建不尊重我的 git 子模块

我正在一个bazel build由 git 子模块组成的项目中运行，具有以下结构：

构建命令如下所示：

我收到以下错误：

似乎在抱怨这/work/train/DeepSpeech/.git不是一个目录，这将是正确的，因为它/work/train/DeepSpeech/.git是一个文件，包含 git 子模块的 git 树的路径。

以下是的内容/work/train/DeepSpeech/.git：

我的问题是：有没有办法让 bazel 尊重我的存储库的子模块结构？理想情况下，我可以在bazel build命令中传递一些标志，使其神奇地工作，但我对其他选项持开放态度。

谢谢你的帮助！

git bazel mozilla-deepspeech

2018-11-21T21:54:30.380

1 2 3 4 5 6 7 8 9 10

问题标签 [mozilla-deepspeech]

Reference