问题标签 [google-speech-api]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
google-speech-api - 异步识别返回 429 RESOURCE_EXHAUSTED 状态
我想识别一些音频文件,所以我将它们上传到存储桶。这些音频文件长约 45 分钟;异步识别是强制性的。
我已经识别出一对音频文件,但服务speech.asyncrecognize从几个小时前开始向我返回 429 RESOURCE_EXHAUSTED 状态。
我的 GCP 项目启用了 Google Cloud Speech API 并设置了账单信息。API 的全部配额可用,我只有 10 个音频文件要识别,所以这不是音量问题。
那么,为什么我会得到这个 429 状态?我知道这个 API 是测试版,但奇怪的是它突然停止工作。
我正在通过 REST 和 Python 使用这个 API。我的代码看起来像这样:
它返回:
它工作了两次,但现在失败了。有同样问题的人吗?
google-chrome - Chrome 语音 API 和谷歌语音 API 有什么区别?
我一直在尝试将语音识别 stt 集成到我的项目中,在尝试了各种之后,我发现 chrome 的原生网络语音 API 是最好的。在性能和准确性方面与谷歌的语音 API 相比如何。
java - Java Google Speech API 代码失败
我正在尝试在我的 java 应用程序中使用谷歌语音云 API 版本 2。不知道问题出在哪里,但是当我尝试 URL 和相同的音频时,PHP 中的配置设置有效并且我得到了响应。请帮忙。
代码
回复
android - 在 Android 中使用 Google Speech Api 将预先录制的文件转换为文本
使用谷歌语音 API,我们可以使用给定的链接将语音转换为文本。但我已经有一个音频文件,我希望将该文件转换为文本。请帮忙。谢谢你。
php - 对于超过 1 分钟的音频,Google Cloud Speech API 不返回任何内容
短于 1 分钟的音频文件可以毫无问题地转录,但是当我尝试转录较长的文件时,Google Speech API 返回一个空响应。
我使用以下 SoX 命令制作我的 .wav 文件:
该文件按预期播放。运行 SoXi,我得到以下信息:
然后我将它上传到我的 Google 存储,因为文档指出任何大于 1 分钟的文件都必须驻留在 gs 存储桶中,以便 API 转录它。
然后我运行以下代码开始转录操作:
返回的响应是空的。完整的响应如下所示:
表示请求已成功运行并完成,但没有任何实际响应。我哪里错了?
python - 为 Google Speech API 创建合适的 WAV 文件
我正在使用 pyaudio 将我的声音录制为 wav 文件。我正在使用以下代码:
我正在为 Google Speech API 使用以下代码,它基本上将 WAV 文件中的语音转换为文本:https://github.com/GoogleCloudPlatform/python-docs-samples/blob/master/speech/api-client/transcribe。 py
当我尝试将 pyaudio 生成的 wav 文件导入 Google 的代码时,出现以下错误:
我为此使用了以下解决方法:我正在使用 ffmpeg 将 WAV 文件转换为 MP3,然后我再次使用 sox 将 MP3 文件转换为 wav:
谷歌的 API 可以处理这个 WAV 输出,但由于质量下降太多,它的表现并不好。
那么如何在第一步使用 pyaudio 创建 Google 兼容的 WAV 文件呢?
android - 用字符串输入谷歌好吗?- 安卓
现在有没有办法向谷歌发送一个字符串并得到回复?
例子:
发送“现在几点?” 并从谷歌获得一个字符串或音频响应,上面写着“现在是下午 4:32”。
android - 如何从 Android 使用 Google Cloud Speech API?
我有一个大学项目,我正在开发一个充当翻译器的 Android 应用程序。对于普通文本翻译,我使用的是 Google Cloud Translation API,我看到他们可以选择使用 Google Cloud Speech API 通过语音翻译文本。问题是我没有起点,也不明白如何使用它。
那么,是否有一个示例说明如何从我的 Android 应用程序中使用 Google Cloud Speech API?
node.js - 仅在 Gloud 上托管的 Google Speech Api 配额
所以,我正在为客户做一些 POC 的工作。我们需要的一件事是将大型录音转录成文本。我们正在为此尝试谷歌,因为我们过去使用他们的云服务取得了良好的效果。
然而,我们一直遇到的问题是我们在测试中达到了配额,而不仅仅是任何配额。仅限我们 gcloud 存储桶中托管的文件的配额。
我们发送本地文件(在本地文件的限制下),我们很好。
当我尝试使用 gcloud 处理更大的文件时,我收到了这个错误: