我目前正在使用 Watsons 强大的语音转文本 API,它在麦克风输入上返回 JSON(?)。
这是返回 JSON 文件的代码的一部分:
service.recognizeUsingWebSocket(audio, options, new BaseRecognizeCallback() {
@Override
public void onTranscription(SpeechResults speechResults) {
System.out.println(speechResults);
}
});
我目前正在尝试做的是获取 SpeechResults json 的“成绩单”部分(参见输出),但它似乎不适用于使用 json 解析器的典型 json 描述,因为 SpeechResults 不是细绳。
你们有任何想法如何实现这一点吗?
这是输出:
{
"result_index": 0,
"results": [
{
"final": true,
"alternatives": [
{
"confidence": 0.908,
"timestamps": [
[
"are",
0.03,
0.2
],
[
"you",
0.2,
0.36
]
],
"transcript": "are you ",
"word_confidence": [
[
"are",
0.838
],
[
"you",
0.982
]
]
}
]
}
]
}