0

我有一个项目,我想在网站中实现语音识别。想象一下,用户正在打一个视频电话,也没有空闲的手来进行交互。如果它只识别一些关键字(如“快照”或“菜单”)就足够了。

我让它在 chrome (x-webkit-speech) 中工作,但它必须在 IE8 中。

其他条件:

  • 如果可能的话,应该一直录音(就在打开主页的时候)。因此,即使用户正在与另一个人交谈,它也应该在听到关键字时做出反应。我不想要像 SIRI 这样你按下按钮开始录制的东西
  • 电话非常保密。我正在做这件事的公司不想将整个对话发送给谷歌,在那里可能会对其进行分析并保存内容。

我不希望有人给我一个完整的解决方案,但是由于我对此很陌生并且很着急,如果有人能指出我正确的方向,我将不胜感激:)

谢谢!

4

1 回答 1

0

我只是偶然发现了我自己的问题......这是我的解决方案:

我们用闪光灯录制了声音。将其转换为 .wav。连接到 ac#-server 的套接字并将文件作为字节数组发送。问题:由于您只接收字节,客户端必须先发送大小并用某种字符终止它,以便您知道它何时结束。您不能只取一个随机字符并用它终止 wav 文件。如果你没有得到大小拳头,你永远不会知道传输何时完成。

c#-server 使用 .NET 4 运行。?具有语音识别功能。分析 .wav 文件并将字符串发送回客户端。flash 可以调用 javascript 中的方法 => 问题解决了!

当然这很丑,但我们的客户仍然对它非常满意,因为它有效并满足了他要求的所有条件。

于 2012-09-26T12:51:18.340 回答