我们需要使用大量已经音位转录的自定义词汇表构建一个自定义模型,但是当前用于指定自定义单词的 API 没有用于指定音位字符串而不是手动生成的临时“sounds_like”正字法字符串的选项。由于我们还没有找到任何可靠的工具来按规则从音素字符串生成等效的“听起来像”字符串,这对我们能够成功使用 IBM 语音到文本引擎来说是一个真正的障碍。
是否有公认的语音/音位字母表和可用的 API 机制来指定音素字符串而不是另一种正字法,以指示通过 IBM 云语音到文本 API 将自定义单词添加到自定义模型时的发音?(即类似于 IPA 以及在 IBM 的文本转语音 API 中使用它的机制?)
(或者,IBM 或那里的任何人是否有一个很好的工具可以将音素序列转换为正字法,保证被他们的 ASR 引擎重新转换回相同的音素字符串?)