ibm-cloud - Watson语音到文本服务如何在java中返回英语以外的语言

Question

当我尝试将模型设置为“zh-CN_BroadbandModel”的 STT Java 代码时，无法获得预期的结果。

这是我的示例代码：

public static void main (String[] args) {

    SpeechToText service = new SpeechToText();
    service.setUsernameAndPassword(USERNAME, PASSWORD);

    File file = new File("C:/IBM/Watson/APIs/speech-to-text/test.wav");

    Map<String, Object> params = new HashMap<String, Object>();
    params.put("audio", file);
    params.put("content_type","audio/wav");
    params.put("model", "zh-CN_BroadbandModel");

    SpeechResults transcript = service.recognize(params);

    System.out.println(transcript);
}

语音结果如下：

{"results": [{
      "final": true,
      "alternatives": [
        {"transcript": "?? ? ? ? ?? ? ? ? ?? ??? ? ??? ?? ? ? ?? ?? ? ??? ? ?? ? ?? ?? ? ?? ? ?? ? ?? ?? ? "}]}],
  "result_index": 0
}

我尝试将模型更改为“en-US_BroadbandModel”，即使使用相同的 wav 文件，它也会返回英文单词（尽管 wav 是中文的）。在这种情况下，我认为“模型”设置确实会影响。

但在响应中，我可以看到本地是en_US.

有什么方法可以设置语言？

score 5 · Accepted Answer

这是 Windows 中 Java 使用的控制台输出编码的问题。

Windows 上的默认控制台输出编码不是UTF-8而是CP850。

使用具有显式编码的 PrintStream 来查看结果。

PrintStream out = new PrintStream(System.out, true, "UTF-8");

ibm-cloud - Watson语音到文本服务如何在java中返回英语以外的语言

1 回答 1

Related

Reference