0

这是一个两部分的问题。

我正在编写一个使用谷歌语音到文本流的统一应用程序,并且注意到如果用户继续谈论大约一分钟而没有暂停,谷歌即使他们还没有休息,也会发送 IsFinal。

用户不太可能直接说 1 分钟,但如果他们这样做,我们希望在单个响应中捕捉到这一点。这是故意的吗?我环顾四周,但不太确定。

另外......当用户确实休息时,我们可以将谷歌在发送 IsFinal 之前等待的秒数增加到 3 秒左右吗?

这样我们就可以在向用户发送响应之前增加我们等待的窗口,以防万一他们还没有完成。

可以理解,这可能与 1 分钟的限制相冲突。

我用来处理流媒体库的代码: https ://github.com/oshoham/UnityGoogleStreamingSpeechToText/blob/master/Runtime/StreamingRecognizer.cs

4

0 回答 0