0

图 1我使用 Class Token "$OOV_CLASS_ALPHA_SEQUENCE" 后的转录结果

父亲的 [档案]称为Annonymos备忘录 a n n o y m o u s,日期为222019 [ 22 2 2019 ] 电话会议

图 2支持的 Google 类令牌

支持的类令牌

此页面可以显示支持的类标记,用于在gb中使用 Speech-to-Text for English 进行语音适应。

类令牌 描述 口语例子 书面例子
$OOV_CLASS_ALPHANUMERIC_SEQUENCE 一系列字母 [az] 和/或数字。 “abc”
“一二三”
“a b c 一二三”
美国广播公司
123
ABC123
$OOV_CLASS_ALPHA_SEQUENCE 一系列字母 [az]。 “abc”
“cqbc f”
“hqqgwrmy o”
美国广播公司
CQBCF
HQQGWRMYO

图 3标点符号无法识别

我们审阅了索赔书,被告的撇号回复之前

通过在这个场合。停止段落的问题是我们如何进行问号我说我们可以 在理论上用逗号从精神科医生那里获得报告,但他将不得不进行评估。泌尿系统症状括号 它们是近括号,如果有括号,请考虑影响括号

我在提高听写转录的准确性方面遇到了 2 个麻烦。请看我上面附上的图片。

  1. 我使用了带有 Class Token 和 boost 的 Google Speech Adaptation Feature。但仍与图 1 中一样,当拼写名称时,结果并未显示为单词,而是显示为单个字母。在听写中,拼写名称有很多习惯,即使我使用了类标记“$OOV_CLASS_ALPHA_SEQUENCE”,它也没有显示为单词。

  2. 另一个问题是标点符号问题。在听写中,人们说,停止,逗号,问号,括号之类的格式。但是我在我的代码中启用了自动标点符号,但标点符号仍然不正确并显示为 Image3 中的单词。

有什么办法可以改善这些问题。或者我错过了什么。如果是这样,你能告诉我方法吗?非常感谢您提前提供的时间。

谢谢你。

4

0 回答 0