我一直在开发一个使用语音识别服务的安卓应用,但安卓设备没有安装谷歌应用。出于这个原因,我使用 vosk API 进行语音识别,但为了提高语音识别的准确性。我需要使用更大尺寸的模型。这需要大量的资产空间。那么,如何在不包含资产或直接从在线服务器使用它们的情况下访问 vosk 模型呢?
编辑:-
我在 vosk 中看到了 Kaldi 的 WebSocket。这可以帮助我使用在线服务器上的 vosk(https://github.com/just-ai/aimybox-android-sdk/tree/master/kaldi-speechkit#online-mode)吗?在此,他们提供了有关如何使用 WebSocket 的信息并给出了一个示例,但我无法理解如何制作 WebSocket 文件。
任何有关此的帮助都是有帮助的!