0

我只是对这个场景感兴趣。假设您正在构建一个 Web 应用程序,并且希望接收语音命令并根据语音到文本的结果执行操作。

是否有任何主要障碍可能使其成为杀手级应用程序?

4

2 回答 2

0

我首先想到的可能是传输的音频质量很大程度上取决于用户的上传带宽。带宽越少,质量越低,语音到文本算法检测准确内容的能力就越差。

于 2009-07-18T21:31:06.593 回答
0

低样本音频可用于 s2t 算法。我的问题:

  1. 将音频传输到服务器并进行处理(flash 或 Java 之类的)
  2. 让客户轮询所需的操作
  3. 使其在后端可扩展
  4. 处理 Internet 支持的各种语言、方言、变形和口音
  5. 确保它是通畅的并且有可用的备用
  6. 处理可用性人员的投诉

我确定还有很多,但除此之外。

如果没有人们去“我们要去月球”然后去做,我们会在哪里。去吧 ...

如果它还没有完成,如果你失败或成功,那么你可能会学到一些很酷的东西。

于 2009-07-18T21:35:57.787 回答