我只是对这个场景感兴趣。假设您正在构建一个 Web 应用程序,并且希望接收语音命令并根据语音到文本的结果执行操作。
是否有任何主要障碍可能使其成为杀手级应用程序?
我只是对这个场景感兴趣。假设您正在构建一个 Web 应用程序,并且希望接收语音命令并根据语音到文本的结果执行操作。
是否有任何主要障碍可能使其成为杀手级应用程序?
我首先想到的可能是传输的音频质量很大程度上取决于用户的上传带宽。带宽越少,质量越低,语音到文本算法检测准确内容的能力就越差。
低样本音频可用于 s2t 算法。我的问题:
我确定还有很多,但除此之外。
如果没有人们去“我们要去月球”然后去做,我们会在哪里。去吧 ...
如果它还没有完成,如果你失败或成功,那么你可能会学到一些很酷的东西。