问题标签 [aws-transcribe]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
355 浏览

ibm-watson - 语音转文本标点时间戳?

Google Cloud Speech-to-Text 和 Amazon Transcribe 都提供标点符号单词时间戳。我可以获得标点时间戳吗?具体来说,我想要断句的时间戳(句号、问号、感叹号),例如 0:33 秒、1:01、1:23、1:49、2:05 等。

我想我可以使用 Google 或 AWS 转录一个带有标点符号的文件,然后将转录本分成几个句子,然后为每个句子做一个单词时间戳。如果我可以为getPunctuationTimestamps.

IBM Watson Speech-to-Text 提供关键字定位,但不提供标点符号。

0 投票
1 回答
3021 浏览

python - Amazon Transcribe on S3 Upload:“[错误] BadRequestException:提供的 URI 未指向 S3 对象”

我正在对一组媒体文件尝试 Amazon Transcribe,调整示例文档代码并使用本系列作为参考,以适应任何上传到我指定的媒体 S3 文件夹的内容,但我的测试文件存在问题。

上传存储桶/文件夹路径:

我已验证该文件存在并且存储桶权限授予对 Amazon Transcribe 服务的访问权限。我可以使用相同的 URL 启动手动转录作业,但不能使用 SDK:我还使用上面的路径将它直接链接到函数中,但没有结果。我很欣赏这可能是一个 URL 路径问题,但没有看到太多关于该主题的内容,因此请检查是否存在明显错误。

CloudWatch 日志失败报告:

类似: https ://forums.aws.amazon.com/thread.jspa?messageID=876906慪

0 投票
2 回答
1172 浏览

amazon-web-services - 直接从 Amazon Transcribe 获取结果(无服务器)

我使用无服务器 Lambda 服务通过 Amazon Transcribe 从语音转录为文本。我当前的脚本能够从 S3 转录文件并将结果作为 JSON 文件存储在 S3 中。

是否有可能直接获得结果,因为我想将它存储在数据库中(AWS RDS 中的 PostgreSQL)?

谢谢你的提示

无服务器.yml

handler.js

0 投票
2 回答
80 浏览

ruby-on-rails - 控制器方法不会接受我通过按钮发送的参数,尽管它们已发送

我是一个初学者,我很难弄清楚这一点。

另外,我不知道测试这段代码的方法,因为我正在使用 ActiveStorage 并且给我带来麻烦的方法连接到使用 S3 存储桶内的 URi 的 AWS API,而我的本地文件是,好吧,本地的,所以我真的被困住了。

我在我的一个控制器中编写了一个方法,它接受一个参数(url),虽然我相信我正确地发送了它(从一个按钮)并传递了正确的参数,但它一直告诉我ArgumentError (wrong number of arguments (given 0, expected 1)):

它是这样的:

在我的模型中:

里面的方法transcript_controller.rb(请忽略错误处理,这也可能是错误的):

最后,在我看来:

@transcript.audio.service_url.to_s.split("?").first获取我想要在 S3 存储桶中转录的文件的 uri。


所以我的理由是,如果我按下那个按钮,它应该将url作为参数发送到transcript_controller#request_transcription,它接受它并使其工作。

我想要什么:我想transcript_controller#request_transcription使用 AWS Transcribe 开始转录工作。然后,我将通过 de aws CLI 检查是否确实如此,然后继续进行。

我得到了什么:让ArgumentError (wrong number of arguments (given 0, expected 1)):我发疯的悲伤。

我在服务器日志中看到了什么:

除了这些代码行中可能出现严重错误的所有其他事情之外,您能帮我url在 request_transcription 方法中找到它吗?提前致谢

0 投票
1 回答
974 浏览

amazon-web-services - 配置输出 S3 存储桶以允许 AWS Transcribe 存储转录结果时出现问题

我正在尝试在 AWS Transcribe 中配置作业转录,以便将结果自动存储在 S3 存储桶中。

我收到以下消息:

它说明了正则表达式模式,但我认为这是一个权限问题。我无法弄清楚如何使用 IAM 设置此权限,因为当我尝试为服务创建角色时,它没有出现在列表中:

可用于角色的服务列表

文档说:“如果您使用 S3 存储桶,则必须授予 Amazon Transcribe 写入权限。”

如果服务不接受角色,我该怎么做?

0 投票
1 回答
678 浏览

amazon-web-services - AWS 转录 | 无法通过 SDK 使用表格创建自定义词汇表

AWS Transcribe 提供了两个选项来创建自定义词汇表。欲了解更多信息自定义词汇表

  • 使用列表
  • 使用表格

我可以通过 AWS 控制台以两种方式创建自定义词汇表,但是对于 AWS Java SDK,我可以使用列表来创建它。在“使用表格”的情况下,它给了我一个错误

失败原因

您尝试创建的词汇表包含无效字符或格式不正确的术语。有关更多信息,请参阅开发人员指南。

但是我可以使用表(通过 AWS 控制台)创建相同的词汇,所以我认为我的词汇没有问题。

案例 1:通过 AWS 控制台

需要注意的另一件重要的事情是,当我们使用列表视图创建词汇时,AWS 会附加一个结束分隔符 ( ENDOFDICTIONARYTRANSCRIBE )。但是当我们使用表格视图创建词汇时它不会附加这个分隔符

案例 2:通过 AWS Java SDK

在两种情况下(列表和表格),结束分隔符都附加在文件的末尾。我认为这可能是问题所在。

总结一下

我想通过 AWS Java SDK使用表格创建自定义词汇表。我可以通过 AWS 控制台创建相同的内容,但无法通过 Java SDK 创建。

0 投票
1 回答
402 浏览

amazon-web-services - 如何通过 CLI 一次删除所有 AWS Transcribe 作业?

我正在尝试同时删除我的所有 AWS Transcribe 作业。我知道我可以通过控制台将它们一一删除,我也可以通过CLI通过以下命令将它们全部删除:

问题是我必须为每项工作都这样做!我正在大规模处理它们(大约 1000 个工作),我不想手动删除每个工作(即使在我的 Mac 上设置了 Automator,这也不是有效的)。有吗无论如何只是删除每个转录作业而不是放入特定的作业名称?

0 投票
2 回答
294 浏览

python - Lambda 在完成后自动删除转录作业

我正在寻找编辑我的 lambda,以便在其作业状态为“完成”时删除转录作业。我有以下代码:

处理这项工作的部分是:

如果作业正在进行中,它会说“正在进行中”,但当它显示“已完成”时,它会删除。

任何想法为什么我当前的代码不起作用?它会完成转录作业,但不会将其删除。

0 投票
0 回答
679 浏览

amazon-web-services - 添加节流异常处理

我需要添加一些代码来处理超出限制的异常,这些异常将在重试尝试之间实现等待时间。例如,在重试启动转录作业之前等待 60 秒。

我尝试增加重试次数,但不确定如何修改重试次数。

我希望上传到语音输入存储桶的所有文件都被转录,并通过等待和重试尝试处理节流限制。

0 投票
2 回答
306 浏览

amazon-web-services - 如何提高 AWS Transcribe 中的转录质量

我有几个音频文件,它们是客户和代理之间的对话成功存储在 S3 中。我尝试使用 AWS transcribe 将音频文件转换为文本,并且转换成功。

但奇怪的是,它甚至没有 60 % 准确,这些是我为 AWS Transcribe 配置的

1) 语言代码 - 英语(印度)
2) 音频 - 8000HZ
3) 格式 - WAV

根据本指南(https://docs.aws.amazon.com/transcribe/latest/dg/limits-guidelines.html),
我将音频频率和格式设置为 8KHZ 并将格式设置为 WAV 我是否需要更改任何其他提高音频质量的参数?

任何帮助表示赞赏。

谢谢,
哈利