2

他们看到的 Watson 语音到文本服务器的最新问题是,一个无法在单个实例中运行持续时间超过 10 分钟的音频文件,其次,有时当语音与 Watson 服务器失去 TCP 连接时to text 正在为少于 10 分钟的文件运行。

他们基本上是在 python 中使用带有 Watson 服务器的 Web 套接字,并想了解为持续时间较长的音频文件运行语音到文本的最佳方式是什么(例如,我们的会议持续到 3 小时)。配置网络套接字连接丢失的瓶颈的最佳方法是什么。

4

1 回答 1

4

我发现如果您使用 WebSockets 并且不请求interim_results,则连接会断开。在问题得到解决之前的解决方法是启用interim_results并忽略它们,直到获得最终结果。interim_results = true您可以通过传入初始化消息来启用中间结果:

{
  "action" : "start",
  "content-type" : "...",
  "continuous" : true, 
  "interim_results" : true,
  "inactivity_timeout": -1, 
  ...
} 
于 2015-12-10T19:33:03.863 回答