1

我有几个音频文件,它们是客户和代理之间的对话成功存储在 S3 中。我尝试使用 AWS transcribe 将音频文件转换为文本,并且转换成功。

但奇怪的是,它甚至没有 60 % 准确,这些是我为 AWS Transcribe 配置的

1) 语言代码 - 英语(印度)
2) 音频 - 8000HZ
3) 格式 - WAV

根据本指南(https://docs.aws.amazon.com/transcribe/latest/dg/limits-guidelines.html),
我将音频频率和格式设置为 8KHZ 并将格式设置为 WAV 我是否需要更改任何其他提高音频质量的参数?

任何帮助表示赞赏。

谢谢,
哈利

4

2 回答 2

0

许多事情都会影响转录质量,例如音频中的背景噪音、说话者重叠、说话者的口音。更高质量的音频通常会产生更好的结果。

于 2020-04-07T04:17:20.137 回答
0

您可以尝试使用自定义词汇表。您可以创建这些自定义词汇表,如此处所述https://docs.aws.amazon.com/transcribe/latest/dg/how-vocabulary.html

此自定义词汇表应该有一些先前的关键字,这些关键字将被说出并且特定于该域。然而,根据我的经验,这些自定义词汇有时会过拟合(错误地从自定义词汇中输出成绩单中的单词)。

于 2020-07-11T08:54:08.627 回答