3

我使用Google API 进行自然对话语音识别的效果非常好,但是对于来自 Youtube 视频或电影的声音,识别效果很差或根本不存在。

在 iPhone 4 上录制我的西班牙语和英语语音的声音是可以识别的,但在电影中使用同一部手机几乎是不可能的,即使是角色说话的场景几乎没有背景噪音。只有一次成功。

我尝试使用噪声和压缩效应通过SoX(Sound eXchange)清理声音,但没有任何成功。

任何想法?或者只是因为您更改了更多无法被 Google API 识别的声音?与其他语音识别软件一起使用会更好吗?

4

1 回答 1

0

Google 语音识别器(和大多数其他识别器)与混响效果不兼容。在大多数视频场景中,人与麦克风之间的距离超过 1-3 米。试着把你的手机放在桌子上,从 3 米远的地方认出 smth。这不会导致任何结果,但音质会非常好。

于 2014-07-25T06:52:25.517 回答