问题标签 [aws-transcribe]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
.net - Amazon Transcribe Streaming Service Speech to text for .NET SDK
我在 AWS .NET SDK 中找不到任何关于转录流服务(从语音到文本)的参考。
它在 .NET SDK Amazon Transcribe Streaming Service 中可用吗?任何参考资料都会有所帮助
amazon-web-services - AWS Lex 是否使用 AWS Transcribe 作为 ASR 进行快速识别?
我正在尝试确定 AWS Lex 是否使用 AWS Transcribe 进行提示确认。例如,Lex 询问“你的电话号码是多少?”,用户回答“1-2-3-4”。然后 Lex 问道,“你说的是 1-2-3-4 吗?”。Lex 在幕后使用什么作为 ASR 来确定用户所说的“1-2-3-4”?是 AWS Transcribe 还是不同的东西?
python - 将 JSON 文件导入 DynamoDB
我是 AWS、DynamoDB 和 Python 的新手,所以我正在努力完成这项任务。我正在使用带有视频的 Amazon Transcribe 并在 JSON 文件中获取输出。然后我希望将这些数据存储在 DynamoDB 中。
目前,当 JSON 文件转储到 S3 存储桶中时,我正在使用 Lambda 函数来自动化该过程。每当该过程发生时,我都会在 CloudWatch 中收到错误消息:
这是我尝试创建 DynamoDB 表然后解析 JSON 文件的 Python 代码:
我对解析嵌套的 JSON 文件不是很熟悉,也没有使用 DynamoDB 的经验。获得此功能的任何帮助都将非常有帮助!
这是我要解析的 JSON 文件:
我似乎遇到的另一个问题是如何处理标点符号,因为 AWS Transcribe 没有为这些项目分配时间戳。
任何帮助表示赞赏,谢谢!
amazon-web-services - 使用 boto3 提取所有 aws 转录结果
我在 aws transcribe 中有几百个转录结果,我想获取所有转录文本并将其存储在一个文件中。有没有办法做到这一点,而无需单击每个转录结果并复制和粘贴文本?
node.js - 带有 Http/2 的 Node.js 中的 Amazon Transcribe Streaming 服务请求没有响应
我正在尝试将 Amazon Transcribe Streaming Service 与来自 Node.js 的 http2 请求一起使用,这是我遵循 Streaming request format的文档链接。根据此文档端点是https://transcribe-streaming .<'region'>.amazonaws.com,但向该 url 发出请求会导致 url not found 错误。但是在Java 示例中发现端点为https://transcribestreaming .''.amazonaws.com,因此向该 url 发出请求不会返回任何错误或响应。我正在从 us-east-1 地区尝试。
这是我正在尝试的代码。
谁能指出我在这里缺少的东西。我也找不到任何使用 HTTP/2 实现此功能的示例。
更新:将 Content-type 更改为 application/json 返回响应状态为 200,但有以下异常:
更新(2019 年 4 月 22 日):
在结束请求之前,我通过序列化添加一个“audioblod”作为有效负载。我的“audioBufferData”是来自浏览器的原始 PCM 音频格式。我从文档中看到有效负载必须编码为“事件流编码”,但无法弄清楚如何实现它。
因此,如果当前没有此事件流编码,我将收到以下异常,响应状态为 200。
amazon-web-services - AWS Transcribe - 无法获取自定义词汇表
我正在构建一个外部站点来管理转录,目前正在尝试获取我使用 API 为 AWS Transcribe 创建的自定义词汇表。我的意图是获取单词列表,将它们显示在文本框中供用户编辑,然后将编辑后的列表发送回 AWS。存在的“GetVocabulary”操作允许我请求自定义词汇,但它只是返回:
响应语法
我尝试以多种不同的方式从“DownloadUri”中抓取/抓取文本文档,但由于收到各种访问/CORS 问题而没有成功。这是我能够绕过正常转录文件的东西,因为它们存储在我自己的 S3 存储桶中,我可以为其设置访问权限。然而,自定义词汇存储在 AWS 自己的默认存储桶的某个位置(我不知道在哪里),因此我无法更改访问权限(或者至少不知道在哪里这样做)。
我目前的解决方法是简单地将 DownloadUri 加载到 iframe 中,让用户简单地将 iframe 中的单词复制并粘贴到文本框中,然后对其进行编辑。不过,这显然一点也不理想/优雅。
任何有关此的帮助/信息将不胜感激,谢谢!
amazon-web-services - AWS Transcribe > Streaming Transcription 功能和用于实时流音频的 Kinesis Video Streams(用于音频输入)有什么区别
嗨,我的要求是我有实时音频流作为输入,比如两个人之间的通话,现在将该音频转换为实时文本,并从提取的文本中选择某些关键字并插入数据库。
根据https://github.com/aws-samples/amazon-connect-realtime-transcription中的架构, AWS Kinesis Video Streams 服务和 AWS Transcribe 都用于直播,但根据链接:https ://aws.amazon.com /blogs/machine-learning/amazon-transcribe-now-supports-real-time-transcriptions/ AWS Transcribe 支持实时转录,那么为什么在 Kinesis 使用的架构中?
如果有人知道,请帮助我理解,希望 Amazon connect 可以将实时音频摄取到 AWS Transcribe 进行实时转录。
python-3.x - 如何将 AWS Kinesis 视频流的音频流输出馈送到 AWS Transcribe 服务?
如何将 AWS Kinesis 视频流 (KVS) 的音频流输出馈送到 AWS Transcribe 服务并获得实时音频到文本的转换?我通过亚马逊连接到 KVS(Kinesis 视频流)摄取音频,我担心的是,哪种格式的 kinesis 视频流 (KVS) 提供(我希望它的有效负载格式),并且 Transcribe 服务能够支持它或我可以转换为 Transcribe 的任何方式服务可以理解。
php - AWS 使用 PHP API 转录:节流异常:超出速率
尝试使用 AWS SDK PHP API 转录存储在我可以访问的 S3 存储桶中的音频文件,如下所示,给了我一个限制异常:超出速率。
我已阅读文档十几次,但找不到一个简单的工作示例来说明如何使用 AWS transcribe 及其 PHP API 成功转录文件。
所以问题是:如何获得转录输出?
顺便说一句,我不需要这个异步......我的小项目等待它处理并返回就可以了。