3

我在本地服务器上运行了以下非常基本的 TTS 代码

using System.Speech.Synthesis;
...
SpeechSynthesizer reader = new SpeechSynthesizer();
reader.Speak("This is a test");

此代码依赖于 System.Speech,我在 VS 2015 项目中为此添加了参考。工作正常,但根据我的阅读和尝试,我知道当代码托管在 Azure 上时,这将不起作用。我已经阅读了几篇关于 SO 查询的帖子是否真的可以在 azure 上进行 TTS。当然,在 2 年前,这似乎是不可能的。如何在 Windows azure 网站上获取 System.Speech?

所有的道路似乎都通向 Microsoft Speech API https://azure.microsoft.com/en-gb/marketplace/partners/speechapis/speechapis/ 我已经注册并获得了用于调用此 API 的私钥和 sec 密钥。然而我的问题是这个。我如何实际调用 SpeechAPI?我必须在上面的简单代码示例中进行哪些更改,以便在 azure 上运行时可以正常工作?

4

1 回答 1

2

您在 Azure 市场中提到的语音 API 是一个名为ProjectOxford的 AI 微软项目的一部分,该项目提供了一系列用于计算机视觉、语音和语言的 API。

这些都是 RESTful API,这意味着您将构建 HTTP 请求以发送到云中的托管在线服务。语音转文本文档可在此处获得,您可以在 github 上找到各种客户端的示例代码。特别是对于 C#,您可以在这个示例项目中看到一些代码。

请注意,ProjectOxford 仍处于预览阶段(测试版)。可以在ProjectOxford MSDN 论坛上找到使用这些 API 的其他支持。

但只是为了让您了解程序的外观(取自 github 上的上述代码示例):

        AccessTokenInfo token;

        // Note: Sign up at http://www.projectoxford.ai for the client credentials.
        Authentication auth = new Authentication("Your ClientId goes here", "Your Client Secret goes here");

        ... 

        token = auth.GetAccessToken();

        ...

        string requestUri = "https://speech.platform.bing.com/synthesize";

        var cortana = new Synthesize(new Synthesize.InputOptions()
        {
            RequestUri = new Uri(requestUri),
            // Text to be spoken.
            Text = "Hi, how are you doing?",
            VoiceType = Gender.Female,
            // Refer to the documentation for complete list of supported locales.
            Locale = "en-US",
            // You can also customize the output voice. Refer to the documentation to view the different
            // voices that the TTS service can output.
            VoiceName = "Microsoft Server Speech Text to Speech Voice (en-US, ZiraRUS)",
            // Service can return audio in different output format. 
            OutputFormat = AudioOutputFormat.Riff16Khz16BitMonoPcm,
            AuthorizationToken = "Bearer " + token.access_token,
        });

        cortana.OnAudioAvailable += PlayAudio;
        cortana.OnError += ErrorHandler;
        cortana.Speak(CancellationToken.None).Wait();
于 2016-03-13T04:29:54.977 回答