问题标签 [google-cloud-speech]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
292 浏览

ruby - ruby Google Speech Recognition API 结果为空

我正在测试 Google Speech Recognition API,但没有结果。

脚本

输出

音频文件来自:音频链接。为什么结果是空的?我错过了什么吗?
我已通过身份验证,但我没有结果。音频文件是示例文件,那么问题出在哪里?

ubuntu 16.04
红宝石 2.3.1

0 投票
2 回答
614 浏览

ios - Google Cloud Speech API iOS 使用 Firebase 存储文件返回 401 UNAUTHENTICATED

我正在尝试使用我的 iOS 应用程序中的 Google Cloud Speech Api 转录长文件(> 1 分钟)。
为此,我执行以下操作:

1) 如文档中所写,我匿名向 firebase 验证用户身份

2)然后我将文件上传到 Firebase 存储并获取 URI

3) 下一步应该是向 Google Cloud Speech API 发送 Asyncrecognize 请求。但我得到 401 错误''。

响应 JSON:

看起来问题出在这行代码上:

我正在尝试传递从 Firebase Anonymous auth 获得的令牌,但它不适合。我已经搜索了我无法找到如何为匿名用户获取正确凭据的获取。请帮忙。

0 投票
0 回答
842 浏览

speech-recognition - 谷歌云语音 api 音频数据传输速度太慢

我正在使用以下方法使用麦克风将语音转换为文本,采样率为 16000。我最初在 Windows 10 机器上对其进行了测试,它运行良好,后来当我在 Windows 7 机器上测试相同的脚本时它不工作正确,我收到以下错误消息。

如何决定在哪台机器上使用哪个采样率?我的 Windows 7 机器可能有什么问题?

请帮我解决这个问题。

0 投票
2 回答
911 浏览

python - 对 Google Cloud Python API 库的身份验证停止工作

我在 Google Cloud API 的 Python 库中的身份验证存在问题。起初它工作了几天没有问题,但突然 API 调用没有出现在 Google CloudPlatform 的 API 概述中。

我创建了一个服务帐户并将json文件存储在本地。然后我将环境变量设置GCLOUD_PROJECT为项目 ID 和GOOGLE_APPLICATION_CREDENTIALSjson 文件的路径。

打印正确的服务帐户电子邮件。

以下代码audio_file成功转录,但我的 Google Cloud 项目的仪表板未显示激活的语音 API 图表的任何内容。

在某些时候,代码也出现了一些关于使用限制的错误。我猜由于身份验证不成功,以某种方式使用了免费/受限选项。

我还尝试了通过安装 Google Cloud SDK 和 进行身份验证的替代选项gcloud auth application-default login,但没有成功。

我不知道从哪里开始解决问题。任何帮助表示赞赏!

(我的系统正在运行带有 Anaconda 的 Windows 7)

编辑: 错误计数(Fehler)随着对 API 的调用而增加。如何获取有关错误的详细信息?!

gclouderror

0 投票
3 回答
2663 浏览

node.js - 谷歌语音 API 超时时间

我正在尝试使用 Speech API 客户端 API 将音频文件转换为文本。

到目前为止,我已经成功转换了一个简短的音频剪辑,但现在有了一个更长的文件(10 分钟),我收到了这个错误:

我在文档中读到异步调用的最大分钟数为每次调用 60 分钟,并且我已将文件上传到 Google Cloud Storage,因为超过 1 分钟的文件需要它。

所以我真的不明白为什么我会收到那个错误,有什么帮助吗?

0 投票
0 回答
561 浏览

python - Google Speech API 速度更快,采样率更高

我正在使用 Google Cloud Speech API Python 库从视频文件中提取文本。在前面的步骤中,视频文件被转换为 flac 音频文件。

为了减少函数花费的时间sync_recognize(),我设置了sample_rate = 16000. 我的想法是与 Web-API 的通信和音频文件的处理应该更快,因为文件大小更小,要处理的数据量更少,信息密度更低。

使用相同的文件列表对 16kHz 和 48kHz 的采样率重复运行时测量会产生:

我期待相反的结果。我的想法错了吗?你对此有什么解释吗?

0 投票
1 回答
2577 浏览

node.js - 将麦克风输入流式传输到 Google Speech API

我研究了 Google Cloud Speech API,并让我的麦克风在 Node 服务器上工作。

然后我想知道从网络前端流式传输麦克风的最佳做法是什么?它是否将音频流从 getUserMedia 发送到 Node 服务器并使用 Node API 客户端将其通过管道传输到 API?还是只是将语音输入保存到我然后传输到 API 的文件中?

目的是“转录”指令(一两句话长)并将结果发送到另一个 API。

0 投票
2 回答
1001 浏览

android - 获取生产 Android 应用程序的 Google Speech API 访问令牌

我在 Android 应用程序中使用 Google Speech API。自述文件指出: In this sample, we load the credential from a JSON file stored in a raw resource folder of this client app. You should never do this in your app. Instead, store the file in your server and obtain an access token from there.

是否有关于如何正确获取生产应用程序的访问令牌的示例?

从我收集的信息来看,我似乎可以使用通过 Compute Engine 或 GAE 提供的应用程序默认凭据,但我不知道如何使用访问令牌实际响应我的应用程序。

0 投票
1 回答
7253 浏览

google-cloud-platform - 请求 Google Cloud Speech API 请求中的错误

当我向 Google Cloud Speech API 发出请求时出现此错误:"error": { "code": 400, "message": "Request contains an invalid argument.", "status": "INVALID_ARGUMENT

我的 curl 命令如下所示: curl -s -k -H "Content-Type: application/json" -H "Authorization: Bearer xxxxxxx" \ https://speech.googleapis.com/v1beta1/speech:syncrecognize -d @同步请求.json

我的配置文件是这样的:

请求中缺少什么或无效的内容?谢谢。

0 投票
1 回答
364 浏览

google-cloud-speech - 谷歌云语音 API 功能,用于无意义的词或语音

API 是否可以返回声音文件所说的语音?或者,是否可以提供非真实的词汇?

我有一个外语教程,我可以在其中使用它。例如,它教授非拉丁字母,如西里尔文、希伯来文、阿拉伯文、中文等......

我有一个无意义词库来帮助学生学习;无意义单词与真实单词的原因是它一次将步骤分解为两个字母;起初,仅用这些字母可以创建的真实单词并不多。

我想展示其中一个无意义的单词,记录学生说的话,然后验证他们说的是否正确,以便给他们反馈。