1

我正在尝试编写一个节点应用程序,通过 AWS 的流转录服务从麦克风转录音频。我到目前为止所拥有的可以在这个存储库中找到(它很小)。

不幸的是,上述方法不起作用。我相信在获取麦克风流提供的数据并在将其传递到可写转录器流之前对其进行转换存在错误。这是因为我已经证明该应用程序的其他两个组件可以正常工作

  1. 我编写了一段应用程序来将麦克风连接到扬声器,证明麦克风流按预期工作。
  2. 当通过 WebSocket 向转录服务发送请求时,它会返回非异常响应,尽管是空的,证明转录服务客户端按预期工作。

作为旁注,我不熟悉处理音频数据并将其编码(解码?)为 PCM。我什至不确定麦克风流给我的是否是 PCM,以及我是否需要在将其提供给转录服务之前从 PCM 解码或编码为 PCM。所有这一切都是说,我很确定字节处理是问题所在。

任何帮助进行排序将不胜感激。

谢谢,杰夫

4

1 回答 1

1

此处概述了发送到 Amazon Transcribe 流式传输的数据帧需要以特定方式编码。

由于您使用的是 WebSocket 流,AWS 有一个 JavaScript 示例项目,您可以参考/使用:https ://github.com/aws-samples/amazon-transcribe-websocket-static

于 2020-06-04T15:20:35.480 回答