问题标签 [aws-transcribe]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
714 浏览

node.js - 将音频麦克风数据流式传输到节点中的 aws 转录

我正在尝试编写一个节点应用程序,通过 AWS 的流转录服务从麦克风转录音频。我到目前为止所拥有的可以在这个存储库中找到(它很小)。

不幸的是,上述方法不起作用。我相信在获取麦克风流提供的数据并在将其传递到可写转录器流之前对其进行转换存在错误。这是因为我已经证明该应用程序的其他两个组件可以正常工作

  1. 我编写了一段应用程序来将麦克风连接到扬声器,证明麦克风流按预期工作。
  2. 当通过 WebSocket 向转录服务发送请求时,它会返回非异常响应,尽管是空的,证明转录服务客户端按预期工作。

作为旁注,我不熟悉处理音频数据并将其编码(解码?)为 PCM。我什至不确定麦克风流给我的是否是 PCM,以及我是否需要在将其提供给转录服务之前从 PCM 解码或编码为 PCM。所有这一切都是说,我很确定字节处理是问题所在。

任何帮助进行排序将不胜感激。

谢谢,杰夫

0 投票
0 回答
377 浏览

amazon-web-services - Boto3 中的 AWS 转录

我对 boto3 start_transcription_job 函数中的 DataAccessRoleArn 设置有疑问

下面是我的代码:

如果我注释掉 JobExecutionSettings 部分,它会完美运行。但是我想打开 AllowDeferredExecution,这样我就必须分配一个 DataAccessRoleArn。我在此处分配的角色可以完全访问 lambda 和 S3,但我仍然收到如下错误:

0 投票
2 回答
218 浏览

python - 我们如何使用 python 从 azure 函数连接 aws transcribe

通过 AWS lambda,我们曾经使用 aws transcribe 连接

有没有可能我们可以使用 python 从 azure 函数调用 aws transcribe 的方法?

0 投票
1 回答
280 浏览

python - 在 AWS Transcribe 中实时获取 BadRequestException

我从 amazon streaming api 得到这个响应。任何人都可以帮我解决我在这里做错了什么。

b'\x00\x00\x00\xa3\x00\x00\x00ah\x10k\xe1\x0f:exception-type\x07\x00\x13BadRequestException\r:content-type\x07\x00\x10application/json\r:message -type\x07\x00\textception{"Message":"收到意外的 WebSocket 帧。"}\xbd\xceK\x8a'

:message-type exception{"Message":"收到意外的 WebSocket 帧。"}½ÎK

我正在使用下面的代码

导入所有库

使用 Sounddevice 流式传输音频的代码

根据亚马逊转录的要求创建用于连接的 URl

进行 PCM 编码的代码

与 AWS 建立连接以进行转录

0 投票
1 回答
143 浏览

amazon-web-services - Amazon Transcribe Job 文件超过最大大小 2048.00 Mb

我尝试使用位于 S3 上的输入文件创建Amazon Transcribe 作业,文件大小为 4.3 GB,当我尝试创建作业时显示此错误。

我可以用我的视频做什么?我应该转换视频,提取音频还是有什么方法可以使用一些 AWS 服务

错误图片

0 投票
1 回答
82 浏览

python - 在 Python 中发送 mp3 文件而不丢失任何元数据的正确方法。(Base64 或其他)|AWS Lambda | S3 | 转录 | Base64 |

我正在尝试使用亚马逊提供的语音到文本服务 AWS Transcribe 创建一个简单的管道。它将 mp3 或 wav(以及其他格式)作为输入。在尝试构建一种可以从前端获取 MP3 的 API 时,我不断收到format not supported诸如Unsupported audio format: matroska,webm.

生成的 mp3 文件可以在具有正确音频但时间索引损坏的 Windows Media Player 上运行(对于 10 秒的剪辑显示 400 小时),并且根本无法在 VLC 上运行。我相信我可能遗漏了一些关于 base 64 编码的基本知识。

我相信通常传递的前面的标头(例如data:audio/mp3;base64用于 Web UI 解析)并没有真正存储到结果文件中。我在下面有我的代码的最简单的变体。另一个小补充是我需要将 mp3 文件存储在 S3 存储桶上,以便管道工作

客户

服务器

0 投票
1 回答
145 浏览

amazon-s3 - 如何从 s3 服务器端加密客户提供的密钥转录

我正在使用 boto3 和我的烧瓶应用程序将文件上传到 s3 存储桶中,并使用服务器端加密客户提供的密钥。我从加密的 s3 文件中尝试了 start_transcription_job 但我有一个例外

例外:

0 投票
1 回答
123 浏览

websocket - aws Transcribe medical - 请求的语言不支持指定的采样率。使用正确的采样率然后重试

我正在尝试使用网络套接字将实时医疗对话转换为文本。我的工作基于 https://github.com/aws-samples/amazon-transcribe-websocket-static

在我更改为医疗端点之前,它运行良好。在这个阶段我得到错误响应——请求的语言不支持指定的采样率。使用正确的采样率然后重试。

我尝试了不同的采样率,但没有运气。文档说:“以赫兹为单位的输入音频的采样率。接受 16,000 Hz 或更高的采样率。” 我试过但没有运气。

以下是相关的代码部分:

使用医疗端点时,我需要为不同的语言使用什么采样率?

0 投票
0 回答
93 浏览

python - 他们有什么方法可以通过 python 和 librosa 转录大型音频文件吗?

我正在尝试通过这么多平台来做。首先,我尝试使用语音识别模块,但这不起作用。其次,我尝试使用 wit.ai,但它无法处理大文件。最后我尝试了aws transcribe,但我有一个学生帐户,所以我无法连接python ..

0 投票
1 回答
232 浏览

python - 他们有什么方法可以将 vocareum(aws 学生门户)与 Python 连接起来吗?

我曾尝试使用 boto3,但 boto3 重定向到 AWS 的主门户,而不是 vocareum。首先它给了我无法连接到服务器的错误,现在它是

ClientError:调用 ListBuckets 操作时发生错误 (InvalidAccessKeyId):我们的记录中不存在您提供的 AWS 访问密钥 ID。