问题标签 [google-speech-to-text-api]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
67 浏览

html - Web 应用程序中的 Google Speech to text API

我想在 JSF 应用程序(为客户端生成 html)中尝试 Google Speech to text API。我试图搜索,但网络上没有合适的资源。它可用于 Java SE,但不能转换为 Java Web。

谁能指导我如何在使用 JSF 开发的 Java Web 应用程序中使用 Google Speech to text API?

0 投票
1 回答
89 浏览

google-speech-api - 无法使用凭证选项设置谷歌语音构造函数

您好我试图不使用 json 方法并使用凭证选项来启动 gcloud 语音客户端。

但这给了我 Error: 3 INVALID_ARGUMENT: Request contains an invalid argument 错误。

我以相同的方式使用了对话流和其他服务,并且工作正常,如果我在这里遗漏了什么,请告知。

0 投票
0 回答
484 浏览

flutter - 如何在 Flutter 中使用 Speech To Text Google API?

我尝试使用此 API 并返回此错误:

发生异常。
详细ApiRequestError(DetailedApiRequestError(状态:400,消息:'audio.content'(TYPE_BYTES)的值无效,“/data/user/0/br.com.icourier.mobi/app_flutter/gravacoes/2020-02-的Base64解码失败- 03 14:31:42.328870.m4a"))

我试图说出文件的路径 - “/data/user/0/br.com.icourier.mobi/app_flutter/gravacoes/2020-02-03 14:31:42.328870.m4a”

按照我的代码:

有人能帮我吗?

0 投票
1 回答
24 浏览

google-cloud-platform - 如何使用 Google Cloud Speech to Text 我在任何地方都找不到任何信息?

我在使用谷歌云方面需要帮助。语音转文本功能更精确。我在 youtube 上查看过,发现只有旧教程与今天的界面完全不同。我的问题是我在哪里写什么,我写什么以便谷歌云把我的文本分析并作为文本吐出来。非常感谢请帮忙

0 投票
1 回答
375 浏览

java - javax.sound.sampled.LineUnavailableException:行格式为 PCM_SIGNED 16000.0 Hz,16 位,单声道,2 字节/帧

我正在从 Eclipse 中的一个项目中创建一个可运行的 jar,其中包含使用云语音进行语音识别的基本示例代码。无论如何,问题是当我从 Eclipse 运行代码时它工作正常,但是当我创建一个可运行的 jar 并执行它时,它会抛出以下异常:

“ javax.sound.sampled.LineUnavailableException:行格式为 PCM_SIGNED 16000.0 Hz,16 位,单声道,2 字节/帧,不支持 little-endian。”。

她的我的代码:

这是一个通过流音频识别语音的简单代码。

0 投票
0 回答
68 浏览

google-speech-api - 从实时流中转录音频

我正在尝试使用本教程从实时音频流中转录音频:https ://cloud.google.com/speech-to-text/docs/streaming-recognize

我能够让它与麦克风一起使用,但我想知道它是否可以用来转录实时互联网音频流。这可能吗,是否有任何关于如何做到这一点的好资源?

0 投票
0 回答
133 浏览

python - Speech to Text word level Confidence 不适用于 Python 中的 Google API

我在 Python 中为 Google Speech To Text API 启用了单词级别的置信度。但我无法获得单词级别的信心,因为它总是响应“服务没有响应”

0 投票
1 回答
265 浏览

android - 如何在 Android 上使用按钮停止语音识别?

我目前使用 RecognizerIntent 在 Android 应用程序上执行 STT。当用户单击按钮时,会弹出 Google 语音输入屏幕,用户可以说话并被转录。当它足够安静时,弹出窗口关闭并处理输入。

但是,如果仍然有一些背景噪音(尽管已经转录了必要的单词),弹出窗口将不会关闭/处理结果。如果我单击屏幕,弹出窗口会消失,但不会处理结果。

有没有办法点击弹出窗口(弹出的麦克风)来强制应用停止录制并处理它已经转录的结果?

先感谢您!

0 投票
1 回答
497 浏览

speech-recognition - 是否可以从一个帐户同时执行两个语音到文本流?

所以,问题是标题,我可以为一个用户创建语音到文本流,效果很好,但是当我尝试连接第二个用户时,它对所有人都不好,有时它对一个用户很好,所以问题是,可以我使用一个 GOOGLE_APPLICATION_CREDENTIALS 同时为两个或多个用户创建语音到文本流,还是每个用户都需要开始自己的项目?

0 投票
1 回答
173 浏览

python - python中.mp4到.wav的转换花费了太长时间

我必须使用该库将 .mp4 转换为 .wav 以使用 google 的语音转文本 API 获取转录。但是转换一个 40 MB 的文件大约需要 5 分钟。我已经尝试过moviepy和其他库。请建议使用什么。