我正在尝试确定 AWS Lex 是否使用 AWS Transcribe 进行提示确认。例如,Lex 询问“你的电话号码是多少?”,用户回答“1-2-3-4”。然后 Lex 问道,“你说的是 1-2-3-4 吗?”。Lex 在幕后使用什么作为 ASR 来确定用户所说的“1-2-3-4”?是 AWS Transcribe 还是不同的东西?
问问题
1148 次
1 回答
4
我认为除了 AWS 之外没有人知道,但 Lex 使用背后的力量AWS Transcribe
(以及AWS Polly
从 Lex 返回语音)确实是有意义的。就个人经验而言,直到在 reInvent 17 上宣布 Transcribe 的大约一个月前,我一直在使用Lex
STT(语音转文本)。然后这是可能的,因为intents
可以忽略并传递给Lambda
处理程序。提供给Lambda
处理程序的 JSON 数据包包含已识别的语音(作为文本),我将其返回给调用者。然而,在他们宣布之后的某个时间Transcribe
,这停止了工作,因为在intents
不能再被忽视了。除了那些输入之外的任何输入intents
将返回配置的错误响应。我的猜测是他们在启动 Transcribe 时停止了这一点。
附录:AWS Transcribe
纯 ASR(自动语音识别或语音转文本)。它返回识别的语音和元数据(置信度等)。
AWS Lex
您可以设计自己的机器人来自动响应查询(例如在 Alexa 中)
于 2019-02-13T15:06:11.337 回答