我想使用 Sphinx 进行语音识别。
我正在寻找使用 Java 或 Python 捕获 Ekiga VOIP 软件电话的输出/传入音频并将其传递给 Sphinx。现在,输出指向 PulseAudio JACK Sink。
抱歉,如果我没有使用正确的术语,因为我对此很陌生。
如果您能指出我正确的方向,将不胜感激,谢谢。
您需要正确格式化您想要完成的任务并为此选择正确的工具。软件开发人员不会在他们的项目中使用像 Ekiga 这样的桌面应用程序。只是因为桌面应用程序是为用户编写的,而不是为软件开发人员编写的。您只能在源代码中修改像 Ekiga 这样的桌面应用程序,但那是完全不同的故事。
如果您想拥有一个 VOIP 端点并将其连接到语音识别服务,您需要查看 IVR 系统和类似的东西。IVR 系统是通过 VOIP 协议实现复杂交互的特定工具。一些例子是:
GNU Gatekeeper - 一个项目建立在与 Ekiga 相同的 Opal 技术之上
您可以设置 freeswitch 以等待呼叫并将它们传递给 pcoketsphinx。你可以用 Asterisk 做同样的事情。有关更多详细信息,请参阅