1

如果有人能帮我解决这个问题,我将永远欠他们的债。

在没有陷入细节的情况下,我正在尝试对应用程序进行编程,例如,当应用程序当前启动时,如果我说“激活功能 A”,这是我的应用程序中已经存在的特定功能,被激活。

我解释清楚了吗?换句话说,手机屏幕上有一个按钮,上面写着“功能A”。当软件“武装”并处于收听模式时,我希望用户能够简单地说出“激活功能 A”(或我选择的任何其他短语),并且屏幕选项将被选中,而无需用户用手按下按钮,而是通过语音命令选择/激活该选项。

我和我的程序员在整合这种新的语音命令功能时遇到了困难,即使显然可以使用语音命令进行谷歌搜索。目前还有其他语音命令应用程序在流通,例如短信听写应用程序、电子邮件编写应用程序等,因此创建语音命令应用程序显然是可能的。有谁知道这是否可行,如果可以,您对如何实现此功能有建议吗?

问题2

假设我们无法通过语音命令激活功能A,是否可以使用语音命令使电话拨打电话,并且该电话被我们的服务器接收?服务器然后“ping”iPhone 并指示它激活功能 A?要使此解决方法起作用,我需要能够确定确切的短语。换句话说,不能强迫用户使用“调用函数A”这个词。我需要能够选择启动该功能的短语。希望我已经清楚了。

换句话说,作为我们在使用语音命令激活应用程序中的特定功能时所面临的障碍的潜在解决方法,是否可以利用手机中已经存在的语音命令功能?又名,打电话?然后这个呼叫被我们的服务器接收到,服务器相应地ping 发出呼叫的电话,并指示它激活该功能?

在我的应用程序可以接收来自服务器的指令之前,我显然理解当前启动应用程序的必要性。

如果有人能帮我解决这个棘手的问题,说你会改变我的生活一点也不夸张!

非常感谢你们中的一个善良的灵魂可以提供的任何帮助!!!

迈克尔

4

1 回答 1

0

我不相信 iPhone 带有任何内置的语音识别功能。考虑与 Nuance 讨论购买和嵌入他们的语音识别引擎之一。他们有适用于 iPhone 的 DragonDictate,但他们也提供了相当数量的其他识别引擎,用于不同的功能。嵌入式解决方案显然是他们的专业领域之一。

您将音频推送到服务器的其他途径可能比您预期的要复杂得多。通常,此过程涉及端点(何时存在语音)和基本特征的识别,因此不需要传递原始流。同样,对您打算使用的语音识别引擎的调查可能会为您提供所需的数据处理细节。将所有手机的连续原始语音传递到您的服务器可能不切实际。

于 2010-01-17T13:00:17.723 回答