在寻找一种通过 Flash 使用语音识别的方法时,我遇到了 VoiceXML。我已经阅读了 W3C 对它的描述,但我仍然有一些很大的疑问。
我可以简单地创建一个 vxml 文档并将其放在我的网络服务器上吗?有什么要求?
它会起作用吗?
我可以通过互联网使用麦克风输入吗?
我似乎找不到直接的答案。
在寻找一种通过 Flash 使用语音识别的方法时,我遇到了 VoiceXML。我已经阅读了 W3C 对它的描述,但我仍然有一些很大的疑问。
我可以简单地创建一个 vxml 文档并将其放在我的网络服务器上吗?有什么要求?
它会起作用吗?
我可以通过互联网使用麦克风输入吗?
我似乎找不到直接的答案。
您需要相当于知道如何处理 VoiceXML 的浏览器。
我在电信行业工作,所以这通常意味着通过旧式电话连接或 VoIP 连接到公共电话网络的软件。该领域有许多商业和一些开源解决方案。
还有一些其他的实现,比如Opera和可访问性领域的一些研究计划,但我还没有看到它们获得太多支持。
我不会将 VoiceXML 视为处理语音识别的最简单方法。也就是说,没有简单的方法,也没有很多免费/开源的解决方案。Microsoft 平台上最简单的方法是查看 Microsoft 的 SAPI 层以及它们提供的免费、最小的 ASR。在 Linux 方面,请查看CMU Sphinx。
VoiceXML 是一种标记旨在通过语音(通常是电话)传递的内容的方法。就像 HTML 是您如何格式化您希望在 Web 浏览器上显示的内容一样,VoiceXML 是您将其传送到电话的方式。
VoiceXML 本身不会进行语音识别。但是许多 VoiceXML 提供商也将语音识别(也称为 ASR)引擎与他们的 VoiceXML 平台捆绑在一起。
如果您正在寻找一种将来自计算机上的麦克风的语音输入识别为某种桌面应用程序的方法,那么 VoiceXML 可能不是您想要的。
维基百科在http://en.wikipedia.org/wiki/List_of_speech_recognition_software上有一些语音识别软件的列表
如果您确实想了解有关 VoiceXML 的更多信息,请参阅 http://vxml.org/上的一些很好的文档