javascript - Google Cloud Speech 错误 500（内部服务器错误）

Question

我有一个在 xampp apache 中运行的简单 JS 代码。

var rawFile;
var allText;
var byteArray = [];

rawFile = new XMLHttpRequest();
rawFile.open("GET", "brooklyn.flac", false);
rawFile.onreadystatechange = function ()
{
    if(rawFile.readyState === 4)
    {
        if(rawFile.status === 200 || rawFile.status == 0)
        {
          allText = rawFile.responseText;
            //alert(allText);

        }
    }
     if (rawFile.status != 200) return byteArray;
        for (var i = 0; i < rawFile.responseText.length; ++i) {
        byteArray.push(rawFile.responseText.charCodeAt(i) & 0xff)
        }
     }

rawFile.send(null);

function send(){
var oAjaxReq = new XMLHttpRequest();

var payload = {
  config:{
    encoding: "FLAC",
    sampleRateHertz: 16000,
    languageCode:"en-US"
  },
  audio: {
    content: rawFile
  }
};

oAjaxReq.open("post", "https://speech.googleapis.com/v1/speech:recognize?key=???", true);
oAjaxReq.setRequestHeader("Content-Type", "application/json");

//object ot json
const jsonPayload = JSON.stringify(payload);

//Length of the jsonPayload
const payLoadLength= jsonPayload.length;
oAjaxReq.setRequestHeader("Content-Length", payLoadLength);
oAjaxReq.withCredentials = true;

 //Send Json to Google Cloud Speech Service
 oAjaxReq.send(jsonPayload);
 }

我正在尝试使用 Google Cloud Speech API。我正在加载一个名为“brooklyn.flac”的本地音频文件，该文件是我通过 xmlHTTPRequest从“ https://storage.googleapis.com/cloud-samples-tests/speech/brooklyn.flac ”下载的。

但是，我总是收到以下错误：

{
  "error": {
    "code": 500,
    "message": "Internal error encountered.",
    "status": "INTERNAL"
  }
}

当我将 payLoad 对象的音频部分从“content：rawFile”更改为“uri：“gs://cloud-samples-tests/speech/brooklyn.flac”时，它工作正常。

错误是因为“rawFile”吗？如果是，如何正确加载此本地文件以将其发送到云服务？

score 1 · Accepted Answer

TL;DR - 除了你的音频内容，其余的有效载荷对我来说看起来不错。您很可能没有使用base64（因为您没有提到任何有关它的任何内容）对音频进行编码，因此遇到了服务器错误。传递base64音频内容的编码版本将解决此问题。

音频内容的 API 类型和来源

使用 Cloud Speech API 有两种主要方式：

使用基于 JSON 的 REST API
使用基于 gRPC 的 API

它们都支持来自以下任何一个的音频内容：

谷歌云存储
您在请求中直接发送的原始文件。

使用 Google Cloud Storage 是 IMO 的两种方法中最简单的一种。您将文件上传到 GCS 并传递文件的 URI（例如gs://cloud-samples-tests/speech/brooklyn.flac）。

编码音频内容

如果您将原始文件作为请求的一部分发送，则根据您使用的 API，您需要相应地处理内容：

基于 JSON 的 REST API要求对音频内容进行base64编码。该链接还包含有关如何在 Python、Node.js 和 Java 中执行 base64 编码的示例。
基于 gRPC 的 API 支持二进制文件上传，因此您可以按原样传递原始文件而无需任何额外处理。

谷歌云客户端库

我不确定是否Node.js是一个选项，但如果是这样 - 您可以使用 Google Cloud 客户端库（仅在撰写本文时支持 Alpha 中的语音识别）。该库可以base64为您自动编码文件并提供其他方便的功能。

javascript - Google Cloud Speech 错误 500（内部服务器错误）

1 回答 1

音频内容的 API 类型和来源

编码音频内容

谷歌云客户端库

Related

Reference