1

我有一个日文文本,我正在使用 Google Cloud Text to Speech 功能将其转换为 mp3。

我还想为谷歌返回的 mp3 提供单词时间戳。

Google Speech to Text 提供了此功能,但是当我将我从 TTS 获得的文件提交到 STT 时,结果并不总是很好。

获取 TTS mp3 单词时间戳的最佳方法是什么?

4

1 回答 1

0

Google Cloud Speech-to-Text 它是一项基于 ML 的服务,因此预计结果并不总是像您期望的那样“好”,它有其局限性。

我的建议是查看他们关于该主题的相关文档,例如最佳实践指南和讨论它的基础页面。此外,您可以查看他们的问题跟踪器平台中的问题,例如此问题以获取有关它的更多信息,即使您在服务中发现可重现的问题,您也可以将其发布到那里,以便他们的团队知道它。

于 2020-09-11T22:24:32.633 回答