问题标签 [google-speech-api]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
807 浏览

google-speech-api - 异步识别返回 429 RESOURCE_EXHAUSTED 状态

我想识别一些音频文件,所以我将它们上传到存储桶。这些音频文件长约 45 分钟;异步识别是强制性的。

我已经识别出一对音频文件,但服务speech.asyncrecognize从几个小时前开始向我返回 429 RESOURCE_EXHAUSTED 状态。

我的 GCP 项目启用了 Google Cloud Speech API 并设置了账单信息。API 的全部配额可用,我只有 10 个音频文件要识别,所以这不是音量问题。

那么,为什么我会得到这个 429 状态?我知道这个 API 是测试版,但奇怪的是它突然停止工作。

我正在通过 REST 和 Python 使用这个 API。我的代码看起来像这样:

它返回:

它工作了两次,但现在失败了。有同样问题的人吗?

0 投票
1 回答
931 浏览

google-chrome - Chrome 语音 API 和谷歌语音 API 有什么区别?

我一直在尝试将语音识别 stt 集成到我的项目中,在尝试了各种之后,我发现 chrome 的原生网络语音 API 是最好的。在性能和准确性方面与谷歌的语音 API 相比如何。

0 投票
1 回答
134 浏览

java - Java Google Speech API 代码失败

我正在尝试在我的 java 应用程序中使用谷歌语音云 API 版本 2。不知道问题出在哪里,但是当我尝试 URL 和相同的音频时,PHP 中的配置设置有效并且我得到了响应。请帮忙。

代码

回复

0 投票
1 回答
690 浏览

android - 在 Android 中使用 Google Speech Api 将预先录制的文件转换为文本

使用谷歌语音 API,我们可以使用给定的链接将语音转换为文本。但我已经有一个音频文件,我希望将该文件转换为文本。请帮忙。谢谢你。

0 投票
3 回答
1723 浏览

php - 对于超过 1 分钟的音频,Google Cloud Speech API 不返回任何内容

短于 1 分钟的音频文件可以毫无问题地转录,但是当我尝试转录较长的文件时,Google Speech API 返回一个空响应。

我使用以下 SoX 命令制作我的 .wav 文件:

该文件按预期播放。运行 SoXi,我得到以下信息:

然后我将它上传到我的 Google 存储,因为文档指出任何大于 1 分钟的文件都必须驻留在 gs 存储桶中,以便 API 转录它。

然后我运行以下代码开始转录操作:

返回的响应是空的。完整的响应如下所示:

表示请求已成功运行并完成,但没有任何实际响应。我哪里错了?

0 投票
1 回答
2576 浏览

python - 为 Google Speech API 创建合适的 WAV 文件

我正在使用 pyaudio 将我的声音录制为 wav 文件。我正在使用以下代码:

我正在为 Google Speech API 使用以下代码,它基本上将 WAV 文件中的语音转换为文本:https://github.com/GoogleCloudPlatform/python-docs-samples/blob/master/speech/api-client/transcribe。 py

当我尝试将 pyaudio 生成的 wav 文件导入 Google 的代码时,出现以下错误:

我为此使用了以下解决方法:我正在使用 ffmpeg 将 WAV 文件转换为 MP3,然后我再次使用 sox 将 MP3 文件转换为 wav:

谷歌的 API 可以处理这个 WAV 输出,但由于质量下降太多,它的表现并不好。

那么如何在第一步使用 pyaudio 创建 Google 兼容的 WAV 文件呢?

0 投票
1 回答
84 浏览

android - 用字符串输入谷歌好吗?- 安卓

现在有没有办法向谷歌发送一个字符串并得到回复?

例子:

发送“现在几点?” 并从谷歌获得一个字符串或音频响应,上面写着“现在是下午 4:32”。

0 投票
3 回答
13462 浏览

android - 如何从 Android 使用 Google Cloud Speech API?

我有一个大学项目,我正在开发一个充当翻译器的 Android 应用程序。对于普通文本翻译,我使用的是 Google Cloud Translation API,我看到他们可以选择使用 Google Cloud Speech API 通过语音翻译文本。问题是我没有起点,也不明白如何使用它。

那么,是否有一个示例说明如何从我的 Android 应用程序中使用 Google Cloud Speech API?

0 投票
0 回答
198 浏览

go - Google Speech API:置信度为 0.000000

我正在使用 Google Cloud Speech API,如此处所示Go API。

当我运行示例 ( ./caption audio.raw) 时,我得到了正确的语音识别: "transcript:"how old is the Brooklyn Bridge".

但是实例中的Confidence属性SpeechRecognitionAlternative是 0.000000(空)。这是语音 API 的错误吗?我正在使用此处示例中提供的音频文件。

0 投票
0 回答
41 浏览

node.js - 仅在 Gloud 上托管的 Google Speech Api 配额

所以,我正在为客户做一些 POC 的工作。我们需要的一件事是将大型录音转录成文本。我们正在为此尝试谷歌,因为我们过去使用他们的云服务取得了良好的效果。

然而,我们一直遇到的问题是我们在测试中达到了配额,而不仅仅是任何配额。仅限我们 gcloud 存储桶中托管的文件的配额。

我们发送本地文件(在本地文件的限制下),我们很好。

当我尝试使用 gcloud 处理更大的文件时,我收到了这个错误: