我使用Google API 进行自然对话语音识别的效果非常好,但是对于来自 Youtube 视频或电影的声音,识别效果很差或根本不存在。
在 iPhone 4 上录制我的西班牙语和英语语音的声音是可以识别的,但在电影中使用同一部手机几乎是不可能的,即使是角色说话的场景几乎没有背景噪音。只有一次成功。
我尝试使用噪声和压缩效应通过SoX(Sound eXchange)清理声音,但没有任何成功。
任何想法?或者只是因为您更改了更多无法被 Google API 识别的声音?与其他语音识别软件一起使用会更好吗?