amazon-web-services - 如何提高 AWS Transcribe 中的转录质量

Question

我有几个音频文件，它们是客户和代理之间的对话成功存储在 S3 中。我尝试使用 AWS transcribe 将音频文件转换为文本，并且转换成功。

但奇怪的是，它甚至没有 60 % 准确，这些是我为 AWS Transcribe 配置的

1) 语言代码 - 英语（印度）
2) 音频 - 8000HZ
3) 格式 - WAV

根据本指南（https://docs.aws.amazon.com/transcribe/latest/dg/limits-guidelines.html），
我将音频频率和格式设置为 8KHZ 并将格式设置为 WAV 我是否需要更改任何其他提高音频质量的参数？

任何帮助表示赞赏。

谢谢，
哈利

score 0 · Accepted Answer

许多事情都会影响转录质量，例如音频中的背景噪音、说话者重叠、说话者的口音。更高质量的音频通常会产生更好的结果。

score 0 · Accepted Answer

您可以尝试使用自定义词汇表。您可以创建这些自定义词汇表，如此处所述https://docs.aws.amazon.com/transcribe/latest/dg/how-vocabulary.html

此自定义词汇表应该有一些先前的关键字，这些关键字将被说出并且特定于该域。然而，根据我的经验，这些自定义词汇有时会过拟合（错误地从自定义词汇中输出成绩单中的单词）。

2 回答 2