我正在使用 SRGS 语法来优化 Microsoft Speech STT 服务的准确性。我对这种语法有特定的需求,因为我希望它仅通过前缀匹配某些单词,但通过检测获得整个单词。
这是我尝试过的那种规则:
<rule id='test'>
<item>
contain<ruleref uri="grammar:dictation" type="application/srgs+xml"/>
</item>
</rule>
我希望这条规则匹配以下内容:“包含”、“包含”、“包含”
问题是我在声音检测中得到的唯一东西是:“包含和”,“包含他”
这一定是因为我不能同时拥有纯文本(“包含”)和定义单个单词的听写标签。STT 假设这些将是 2 个单独的单词并相应地调整识别结果。
在我的情况下,引用语法的ruleref
标签:听写是必要的,因为如果我改用“垃圾”特殊规则之类的东西,我想我将无法获取整个单词。
任何提示或想法将不胜感激,恐怕在当前的 SRGS 状态下,我正在尝试做的事情可能是不可能的。