-1

我是使用 AWS JavaScript SDK 的新手。我正在尝试创建一个 HTML 页面,如 Amazon Transcribe Medical 的 UI - 实时转录(链接)。实时转录适用于麦克风设备。我的意思是它将语音数据(从麦克风设备输入音频)实时转换为文本,效果很好,我真的印象深刻,并决定创建一个如下图所示的 UI。

在此处输入图像描述

我在https://docs.aws.amazon.com/AWSJavaScriptSDK/latest/AWS/TranscribeService.html#startMedicalTranscriptionJob-property中阅读了 AWS JavaScript SDK 的文档

在此处输入图像描述

但是关于输入音频输入参数(参数)存在混淆MediaFileUri,在上述方法的文档中不允许从麦克风设备捕获音频(或者我找不到麦克风设备的任何输入参数),这是唯一可能的从亚马逊存储桶输入音频文件。

z

那么我如何使用这种方法创建像 Amazon 实时转录这样的 UI?有什么建议可以实现这一点吗?

4

1 回答 1

1

转录医疗支持两种模式:流式和批处理。您使用的 SDK 是批处理 API,如https://docs.aws.amazon.com/AWSJavaScriptSDK/latest/AWS/TranscribeService.html#startMedicalTranscriptionJob-property

用于转录医疗流的 Javascript SDK 尚未发布。但是您可以实现自己的 WebSocket 客户端。

这是关于 Transcribe 医疗流 WebSocket 协议的技术文档:https ://docs.aws.amazon.com/transcribe/latest/dg/websocket-med.html

javascript实现请参考示例代码:https ://github.com/aws-samples/amazon-transcribe-medical-demo/blob/master/src/transcribe/TranscriptionWindow.js#L138-L160

于 2020-04-13T09:52:27.440 回答