node.js - 将音频麦克风数据流式传输到节点中的 aws 转录

Question

我正在尝试编写一个节点应用程序，通过 AWS 的流转录服务从麦克风转录音频。我到目前为止所拥有的可以在这个存储库中找到（它很小）。

不幸的是，上述方法不起作用。我相信在获取麦克风流提供的数据并在将其传递到可写转录器流之前对其进行转换存在错误。这是因为我已经证明该应用程序的其他两个组件可以正常工作

作为旁注，我不熟悉处理音频数据并将其编码（解码？）为 PCM。我什至不确定麦克风流给我的是否是 PCM，以及我是否需要在将其提供给转录服务之前从 PCM 解码或编码为 PCM。所有这一切都是说，我很确定字节处理是问题所在。

任何帮助进行排序将不胜感激。

谢谢，杰夫

score 1 · Accepted Answer

此处概述了发送到 Amazon Transcribe 流式传输的数据帧需要以特定方式编码。

由于您使用的是 WebSocket 流，AWS 有一个 JavaScript 示例项目，您可以参考/使用：https ://github.com/aws-samples/amazon-transcribe-websocket-static

1 回答 1