0

我从他们说 - 的扬声器中捕获音频"I want to meet John Disilva"。我将其传递给 Google Speech API,其中 Phrase as { 'John Disilva', 'Ashish Mundra'}. 但是,Google Speech API 会返回完整的短语,即 - 'I want to meet John Disilva'

有没有办法我只能将我的短语作为返回值,因为我只对提取名称部分感兴趣?

原因是我无法控制别人对我的麦克风说什么。他们可以说'I would like to see John Disilva'or 'Do you know John Disilva',但我确信我的用户在我想要提取的这句话中的某个地方总是有那个名字。

如果 Google Speech API 可以为我提供它能够John Disilva在该句子中检测到的确切短语,那么我可以使用该短语在我的代码中进行进一步处理。

4

1 回答 1

0

这对于 Google Speech API 是不可能的。您最好的选择可能是只进行后处理以查看存在的名称。如果您需要比这更准确的东西,请寻找支持“关键字定位”的 ASR 系统。

于 2017-02-11T05:59:38.640 回答