问题标签 [google-speech-api]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1932 浏览

c# - 使用 httpclient 在 C# 中发送带有 json 字符串的 post 请求和请求正文中的文件

根据https://cloud.google.com/speech/reference/rest/v1beta1/speech/asyncrecognize#authorization,我正在尝试将包含以下信息的发布请求发送到https://speech.googleapis.com/v1beta1 /speech:asyncrecognize在正文中:

我不知道如何在正文中设置这些参数。我们有 json 数据以及要放入正文的音频文件的二进制内容。这是我的代码:

0 投票
1 回答
1217 浏览

c# - 没有预定义语法的 C# 语音识别

我正在尝试将语音识别与 C# 应用程序一起使用,但这样我只能在输出中预测短语:

我可以像 Google Speech Recognition API 一样获得输出,识别语音,不存在的单词并给我输出,或者如果我可以使用带有 C# 的 Google Speech Recognition 会很高兴看到一些例子如何做到这一点?

0 投票
1 回答
1299 浏览

google-app-engine - Google Speech API v1beta1 很慢?

当得知 Google 终于发布了面向开发者的官方语音 API 时,我感到非常兴奋。我一直对 Google 的语音识别在 Android、Chrome 和其他产品中的出色表现感到惊讶。

我创建了一个 Google Cloud 帐户,启用了语音 API,并按照Google Speech API 文档创建了一些测试脚本。准确率超高,但速度慢得离谱。一个 18 秒的音频文件将花费他们的引擎大约 16 秒的时间来转录!Microsoft Bing Speech API 只需 3-4 秒即可完成!

有没有人有同样的经历?还是我的配置有问题?非常感谢任何帮助!

这是我使用的代码:

重击:

0 投票
0 回答
2173 浏览

c# - 使用 DictationGrammar 的 System.Speech.Recognition 准确性

你好,我正在尝试为 C# windows 应用程序找到免费且有用的语音识别。我试过System.Speech.Recognition; 但是如果没有预先录制短语或单词并且我想使用DictationGrammar有时我必须说 20 次相同的短语或单词,但 20 次我的识别结果是错误的。所以我并不是说它不能很好地工作,但它不适用于我的情况。因此,如果我能以某种方式使其更好地工作,请在这里需要您的帮助:

我在使用 Python 进行Google Speech Recognition之前尝试过,它至少正确率为 95%,足以说,这对我来说已经足够了,但显然如果我没有密钥,它就不能免费使用:

说 API 密钥仅用于 Chromium 开发,而不是在此列表中提问https://www.chromium.org/developers/how-tos/api-keys也许还有其他一些使用方法:

我也尝试使用 Bing Speech API,但似乎它仅用于这里的 XAML 应用程序msdn.microsoft.com/en-us/library/dn434606.aspxmsdn.microsoft.com/en-us/library/dn467592.aspx

然后我找到了这个工具列表,但似乎没有什么是免费的http://www.dmoz.org/Computers/Speech_Technology/Toolkits/

0 投票
0 回答
342 浏览

c# - Google Speech API 在 Asyncrecognize 上返回 null

我有点失落,我真的希望你能帮助我。我正在尝试使用 Google Speech API。我的目标是获取一个音频文件,将其发送到 Speech API 并让它返回文本。这是我到目前为止所做的: • 在 Google 上创建了一个项目 • 创建了一个服务帐户 • 注册了一个指向我从 Google 下载的 json 文件的环境变量。• 将 NuGet GoogleSpeechAPI 安装到 Visual Studio 2015

我真的不知道从这里去哪里。到目前为止,这是我尝试实现的:(从 codeproject 上的借用代码修改)

0 投票
1 回答
743 浏览

google-speech-api - Google 语音 API 内部服务器错误 -83104

我最近接触了谷歌语音 API,并试图让官方的 Node.js 演示工作。

但是当我使用 .flac 文件(从我的手机记录并转换)来测试演示时,我从 Google 语音 API 服务器收到了这个错误:

并且音频文件都不会作为gs://前缀 URI 上传到 Google 云存储,base64 字符串内容也不能在 PostMan/curl 中使用。总是得到internal server error -83104

我不知道这个错误代码代表什么意思,有人可以帮忙吗?

0 投票
1 回答
1558 浏览

ruby-on-rails - 将 mp3 转换为 flac 文件

我正在尝试找到一种使用 ruby​​(最好是)服务器端轻松将 mp3 转换为 flac 文件的方法。我有一大群音频,我想使用谷歌语音 api 转录,但它只接受 flac。(除其他事项外)。可以找到一个可以在笔记本电脑上运行的 flac2mp3 转换器,查看代码,不幸的是,它似乎只是调用了一个需要在本地安装编解码器的系统命令。.

有没有可能为我做这个的api?或者是安装编解码器并在 heroku 上运行此类命令的简单方法。

0 投票
3 回答
2036 浏览

c# - 在 C# 中使用谷歌语音 API 返回 403 错误

尝试在 C# 中使用 Google Speech API 返回 403。

在 Google Cloud Platform 中,我生成了一个密钥,但仍然出现 403 错误。

使用此代码:

这可能是一些无效的密钥问题,尝试生成服务器密钥和浏览器密钥,结果相同,403(禁止)

请帮忙。

0 投票
0 回答
172 浏览

cordova - Google Speech API 总是返回空响应

我正在将谷歌语音 api 与科尔多瓦应用程序一起使用。

我正在录制音频并使用cordova插件“cordova-plugin-media”将其保存到我的本地驱动器,之后我正在使用cordova-plugin-file的readAsDataUrl()方法读回文件。这正在返回我的 base64 数据。

如果我将此 base 64 数据传递到 google api 服务器,它将始终返回空结果而没有任何错误。下面是相同的代码。

如果有人解决了类似的问题,请帮助我。

0 投票
2 回答
598 浏览

python - 在 Python 中重命名 defaultdict 键

我有以下问题:我有一个名为 word_count 的默认字典,其中包含单词和它们出现的频率。我通过计算 Google Speech API 的回复得到这个。但是,这个 API 为我返回了诸如德语字母 'ö' 的 '\303\266' 之类的东西。现在我想通过这个字典,测试上面显示的这些东西之一是否存在,并用正确的东西替换它,如下所示:

填充默认字典:

到目前为止它工作正常,我可以打印字典,它可以让我得到带有数字的单词。

现在更换钥匙:

现在这不起作用,我猜是因为我不能 pop(key) 因为它需要一个整数。我该怎么做?我尝试了几种方法,但这里似乎没有任何效果。

任何帮助将不胜感激!

解决方案:

原来这是我的错,因为我对字典进行了排序,从而将其转换为元组列表。感谢所有帮助我解决这个问题的人!