0

Google Cloud Speech-to-Text 和 Amazon Transcribe 都提供标点符号单词时间戳。我可以获得标点时间戳吗?具体来说,我想要断句的时间戳(句号、问号、感叹号),例如 0:33 秒、1:01、1:23、1:49、2:05 等。

我想我可以使用 Google 或 AWS 转录一个带有标点符号的文件,然后将转录本分成几个句子,然后为每个句子做一个单词时间戳。如果我可以为getPunctuationTimestamps.

IBM Watson Speech-to-Text 提供关键字定位,但不提供标点符号。

4

1 回答 1

0

我尝试了 IBM Watson Speech-to-Text 的关键字定位。我提供了一个 48 分钟的 Radio Ambulante 播客,其中有正式成绩单。这是一个高质量的 NPR 播客。我从成绩单中选择了一个句子作为要发现的“关键词”。Watson 用了大约 48 分钟来转录 48 分钟的播客。主持人转录好于90%,受访者好于80%。问题是要工作,我需要 100% 的准确度。例如,一位古巴医生说“Yo meconceaba, no comunista”(“我不认为自己是共产主义者”),但 Watson 听到的是“consideraba común esto”。Watson 从未找到目标句子。

于 2019-06-27T19:34:34.483 回答