我需要使用一些转录服务来转录语音。我使用 AWS transcribe 获得了非常好的结果。但我也需要知道哪个人说了什么。这可以通过 AWS 转录吗?我找不到任何关于此的信息。
前任。我现在得到的是
演讲者1:你好,你好吗?
演讲者2:我很好,你好吗?
演讲者1:好的……
我想得到的是能够知道谁是扬声器 1 和扬声器 2。例如通过上传样本
鲍勃:你好,你好吗?
爱丽丝:我很好,你好吗?
鲍勃:好吧……
这对 AWS 可行吗?
我需要使用一些转录服务来转录语音。我使用 AWS transcribe 获得了非常好的结果。但我也需要知道哪个人说了什么。这可以通过 AWS 转录吗?我找不到任何关于此的信息。
前任。我现在得到的是
演讲者1:你好,你好吗?
演讲者2:我很好,你好吗?
演讲者1:好的……
我想得到的是能够知道谁是扬声器 1 和扬声器 2。例如通过上传样本
鲍勃:你好,你好吗?
爱丽丝:我很好,你好吗?
鲍勃:好吧……
这对 AWS 可行吗?
有两种方法:
这些将识别单独的扬声器。但是,您不能上传“样本”然后识别特定的演讲者。