0

我正在尝试实时转录 OpenTok 会话中的音频。OpenTok API 似乎没有该功能。有什么方法可以以某种形式捕获数据并将其推送到另一个进行转录的脚本/工具?

问题不在于转录,问题在于访问实时音频流数据并实时使用它。

4

1 回答 1

1

您可以通过客户端 SDK 中的https://tokbox.com/developer/sdks/js/reference/OT.html#getUserMedia访问视频/音频流 (MediaStream)。

您可以使用 WebAudio 规范中的可用 API 来操作音频。

从音频 MediaStreamTrack 对象发布音频。例如,您可以使用 AudioContext 对象和 Web Audio API 来动态生成音频。然后,您可以在 AudioContext 对象上调用 createMediaStreamDestination().stream.getAudioTracks()[0] 以获取音频 MediaStreamTrack 对象,以用作您传递给 OT.initPublisher() 方法的选项对象的 audioSource 属性。有关基本示例,请参阅 GitHub 上的 Stereo-Audio 示例 OpenTok-web-samples 存储库。

上面的 GitHub 示例是关于注入音频流的。但是,您也可以在注入之前提取/捕获音频。在此处查看详细信息... https://developer.mozilla.org/en-US/docs/Web/API/Web_Audio_API

于 2020-09-15T12:51:40.353 回答