问题标签 [google-cloud-speech]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
675 浏览

webrtc - 如何从谷歌云语音 API 提高成绩单的准确性

我正在做一个项目,我需要使用 Speech to text 在我的网站中进行搜索。我正在使用谷歌云语音 API 同步 REST API。我在 WebRTC getUserMedia() 库的帮助下从浏览器获取音频。

我目前录制音频的配置是:线性 16、16 位单声道、48KHz。

我还添加了相关的短语提示:首字母缩略词、常用词等。

我面临的问题是,Google Demo 中的准确性远远好于我在应用程序中获得的结果。这里:https ://cloud.google.com/speech/

0 投票
0 回答
140 浏览

c# - 使用 Xamarin / Google Cloud Speech API 将德语文本块拆分为句子

我在 Xamarin.Forms 应用程序中使用 Google Cloud Speech API。不幸的是,API 只是在一段文本中返回口语,没有标点符号、问号等。我知道这可以通过使用 Google Cloud Natural Language API 来完成,但德语尚不存在。我还研究了斯坦福 NLP,但我不知道如何将文本分成句子。

例如,我想转

“Die Sonne scheint die Katze ist weiss”(阳光明媚,猫是白色的)

进入

“Die Sonne scheint。Die Katze ist weiss。” (阳光明媚。猫是白色的。)

0 投票
1 回答
758 浏览

java - Jetty ALPN/NPN 未正确配置尝试使用谷歌语音 API

我正在尝试通过谷歌云语音 API 来查看他们将韩语转换为文本的准确度。

我的操作系统是 Windwos10,使用 Eclipse 和 Maven。我现在正在尝试构建 Maven。但是我不断收到同样的错误。我用谷歌搜索了它,但我不知道。

下面是来自 Eclipse 的日志。

0 投票
3 回答
302 浏览

google-cloud-platform - 生产环境中的 Google Cloud Speech API

众所周知,Google Cloud Speech API现在处于测试阶段。

在生产服务器上的应用程序中使用它是否安全?

我也在搜索正在使用的应用程序Google Cloud Speech API,到目前为止,我找到了以下 内容VoiceBase,,,,HyperconnectInterActiveTel

有谁知道任何其他应用程序可以让我们更有信心在生产服务器上使用它?

0 投票
1 回答
210 浏览

java - Maven 依赖项中的冲突未得到解决

我正在使用用于 Google Speech 和 Google Natural Language Processing 的 Google Cloud API。我用于两者的版本如下:

谷歌云语音:0.13.0-alpha

谷歌云语言:0.9.4-alpha

他们都使用 google-gax api 作为内部依赖。语音 api 使用 gax 版本 0.10.0,语言 api 使用 0.1.4。在 pom 中,我具有提供的依赖范围。所以出于这个原因,我在服务器的 lib 文件夹中提供了 jars。

但问题在于 gax api。问题是:

当我提供 gax 版本 0.10.0 时,语音 api 工作但语言 api 不起作用。

如果提供了 gax 0.1.4 版本,则语言 api 有效,但语音 api 无效。

如果两个版本都提供,那么只有语音 api 有效。

有什么建议可以解决这个问题吗?我已经尝试了所有方法,即清理项目、更新 maven、重新部署项目、删除所有 maven 依赖项并重建。但并没有解决问题。

0 投票
1 回答
84 浏览

google-cloud-speech - 谷歌云语音文本语言

音频文件的返回文本是否始终为英文?我知道有一种方法可以配置音频文件的语言,但是有没有一种方法可以配置输出文本的语言?谢谢。

0 投票
0 回答
561 浏览

android - Android MediaRecorder:AmrWb 和 ThreeGpp OutputFormat 的区别

如果我使用 Android MediaRecorder 记录我的文件,我可以像这样设置它的属性:

它生成一个3gpp -File。如果我将录制的文件发送到 Google Cloud Speech API,音频会被识别并转换为文本:

但是,如果我将 OutputFormat 更改为

它还会生成一个 .3gpp 文件,但 Google Cloud API 会引发错误。这很奇怪,因为我认为 OutputFormat 无关紧要,只是定义了在两种情况下都是 AMR 编码的编码数据的容器。所以我的问题是:

AMR 和 ThreeGpp OutputFormat 之间到底有什么区别?

0 投票
1 回答
607 浏览

node.js - Google 语音 api、node.js 客户端 - 使用“操作”时结果错误

我正在使用 node.js 客户端库,特别是 startRecognition 方法,并使用 Speech.operation 来获得结果。但是,我得到以下结果,而不是结果 - 查看包含一些编码字符串而不是 JavaScript 对象的“值”对象。

有人见过这个吗?这是一个错误吗?或者有没有办法将其解码为 JavaScript 对象?

这是一个演示问题的代码片段:

0 投票
0 回答
835 浏览

c# - 在 PCL 中向 Google Cloud Speech API 进行身份验证

我正在尝试对我的 Xamarin.Forms PCL-Project(便携式类库)中的 Google Cloud Speech Api 进行身份验证。我正在使用 Android 手机进行测试。我的解决方案的代码如下所示:

在一个通常的 .NET ConsoleApplication-Project 中,它的工作就像一个魅力。但是,如果我在我的 PCL 项目中尝试完全相同的代码,我会在以下行出现错误:

其中说:

未处理的异常:System.NotImplementedException:方法或操作未实现

我已经在我的 PCL我的 Android 项目上安装了所有 Nuget GRPC 和 Google Speech API 包。

所以我的问题是:

是否有更好/更简单的方法来使用 Xamarin.Forms 对 Google Cloud Speech API 进行身份验证?如果没有,我的代码有什么问题?

编辑:似乎 Xamarin 不支持 gRPC。我已经设法使用简单的 httpClient 调用发送请求的语音 API。

0 投票
1 回答
2490 浏览

angularjs - 如何将音频从 AngularJS 流式传输到 Google Cloud Speech API

我是 HTML5 Web Audio API 和 Google Cloud Speech API 的新手。我正在尝试将语音识别构建到 AngularJS 应用程序中,以便用户可以使用语音到文本执行搜索,而不是使用键盘输入搜索。

目的是使用 getUserMedia() 从客户端捕获音频并将其流式传输到 Google Cloud Speech API,并异步接收结果。

Google 提供了一组客户端库,允许您从 C#、Node 和 Java 等服务器端平台流式传输到他们的 API,但我找不到显示如何执行以下任一操作的示例:

  • 将音频从 AngularJS 直接流式传输到 Google Cloud Speech API
  • 将音频从 AngularJS 流式传输到自定义 API,该 API 使用客户端库将提要中继到 Google Cloud Speech API

有没有人找到一种方法将音频从 AngularJS/HTML5 客户端流式传输到像 Google Cloud Speech API 这样的 API?