1

有谁知道在使用 Google Speech API 时是否有办法操纵电话号码的识别?我正在尝试实现一个转录场景,其中呼叫者会说出一串字母和数字,但开箱即用的逻辑似乎是尝试将任何数字序列适合电话号码方案,即使这意味着呈现字母成数字,他们可能听起来有点相似(或不相似)。我已经尝试使用语音上下文来操纵“电话号码”中的值,方法是输入并给出整个事情应该作为语音上下文(例如“八七七二蜜蜂三七”),但它拒绝覆盖被解释为电话号码的数字。有没有人遇到过这个问题或知道可以解决这个问题的任何方法?

谢谢!

4

2 回答 2

0

至少在一种情况下,将语言设置为 en-PH(菲律宾英语)似乎已经解决了这个问题,或者至少显着改善了这个问题。其他英语语言选项也可能有效。

en-GB 以英国格式的数字返回,他们先输入一个数字,然后再输入数字的其余部分。

于 2018-08-09T21:31:39.707 回答
0

我不知道有一种简单的方法可以做到这一点。对于 JavaScript 的 Web Speech API,执行以下操作似乎会产生更少的强制转换为电话号码格式的结果:

设置maxAlternatives = 2,例如,

var recognition = new speechRecognition();

recognition.maxAlternatives = 2;

然后使用提供的第二个结果,例如,

constr speechToText = event.results[0][1].transcript

通过处理结果,您可以走得很远。剩下的挑战是,由于结果通常将数字聚集在一起,因此您无法区分一系列单个数字和一个多位数字(例如,'15' & '1'、'5')。这种方法的实用性取决于您的应用程序试图捕获的数字的细节。

于 2018-06-02T17:51:04.023 回答