1

我正在尝试创建一个 Windows 应用程序,我可以在其中获取我拥有的音频文件,并使用 Google Speech Recognition API 将其中的语音转录为文本文件。这是我所做的:

1)我去了这里https://groups.google.com/a/chromium.org/forum/?fromgroups#!forum/chromium-dev并成为会员。

2)我去了我的谷歌开发者控制台并成功生成了一个 API 密钥。

3)我在网上得到了一些代码并运行它:

private void btnGoogle_Click(object sender, EventArgs e)
        {

            string path = @"Z:\path\to\audio\file\good-morning-google.flac";
            try
            {

                FileStream fileStream = File.OpenRead(path);
                MemoryStream memoryStream = new MemoryStream();
                memoryStream.SetLength(fileStream.Length);
                fileStream.Read(memoryStream.GetBuffer(), 0, (int)fileStream.Length);
                byte[] BA_AudioFile = memoryStream.GetBuffer();
                HttpWebRequest _HWR_SpeechToText = null;
                _HWR_SpeechToText =
                            (HttpWebRequest)HttpWebRequest.Create(
                                "https://www.google.com/speech-api/v2/recognize?output=json&lang=en-us&key=your-api-key-here");
                _HWR_SpeechToText.Credentials = CredentialCache.DefaultCredentials;
                _HWR_SpeechToText.Method = "POST";
                _HWR_SpeechToText.ContentType = "audio/x-flac; rate=44100";
                _HWR_SpeechToText.ContentLength = BA_AudioFile.Length;
                Stream stream = _HWR_SpeechToText.GetRequestStream();
                stream.Write(BA_AudioFile, 0, BA_AudioFile.Length);
                stream.Close();

                HttpWebResponse HWR_Response = (HttpWebResponse)_HWR_SpeechToText.GetResponse();
                if (HWR_Response.StatusCode == HttpStatusCode.OK)
                {
                    Console.WriteLine("looks ok...");
                    StreamReader SR_Response = new StreamReader(HWR_Response.GetResponseStream());
                    Console.WriteLine(SR_Response.ReadToEnd());

                    Console.WriteLine(SR_Response.ReadToEnd());
                    Console.WriteLine("Done");
                }



            }
            catch (Exception ex)
            {
                Console.WriteLine(ex.ToString());
            }

            Console.ReadLine();
        }

上面的代码运行。它给了我以下输出:

looks ok...
{"result":[]}

因此,我知道我收到了HttpStatusCode.OK响应,因为looks ok...日志行已执行。

但是,结果完全是空的……这是为什么呢?难道我做错了什么?

编辑:这是我得到音频文件的地方:https ://github.com/gillesdemey/google-speech-v2

4

2 回答 2

4

首先,您的代码比需要的更复杂,我使用了这个:

string api_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
string path = @"C:\temp\good-morning-google.flac";

byte[] bytes = System.IO.File.ReadAllBytes(path);

WebClient client = new WebClient();
client.Headers.Add("Content-Type", "audio/x-flac; rate=44100");
byte[] result = client.UploadData(string.Format(
            "https://www.google.com/speech-api/v2/recognize?client=chromium&lang=en-us&key={0}", api_key), "POST", bytes);

string s = client.Encoding.GetString(result);

您遇到的第二个问题是您的音频文件!它是 32 位立体声。它应该是 16 位 PCM 单声道。所以转换为单声道并下降到 16 位。我使用http://www.audacityteam.org/来转换您的文件。见截图。

然后我得到了这个回复:

{"result":[]}
{"result":[{"alternative":[{"transcript":"good morning Google how are you feeling today","confidence":0.987629}],"final":true}],"result_index":0}

在此处输入图像描述

于 2016-02-11T23:56:46.160 回答
0

如果 Google API 没有返回任何结果,则很有可能无法满足请求。所以你的代码没有问题,只是测试音频。您是否尝试过其他音频文件?我知道这一点是因为我使用过 Google Custom Search API。如果没有找到结果,它将返回空。

于 2016-02-12T08:30:01.357 回答