我试图让网络语音 api 给我正在说出的原始字母。从 api 我发现了这个:
SpeechRecognitionAlternative:成绩单属性 成绩单字符串表示用户说出的原始单词。对于连续识别,必须在必要时包含前导或尾随空格,以便连续 SpeechRecognitionResults 的连接产生会话的正确转录。
虽然我不确定如何使用它。
我需要的是检测用户是否正在发出特定的声音。与医生检查喉咙时发出的声音相同 - 说“AHHHHHHHHH”
网络语音识别的问题在于,它并没有把那个声音看作是一个有效的词,因为它实际上不是。所以我需要在用户发出声音时以某种方式获取原始字母。
这可能吗?
谢谢