我正在使用 c# 和 System.Speech.Recognition 来加载我定义的几个简单语法。当我说出与语法匹配的短语时,引擎以大约 0.95 的置信度正确识别语法。
但是,当我发音甚至不在语法中的单词(甚至来自不同的语言或乱码)时,引擎会随机返回一个匹配的语法,其中随机文本从未发音并且仍然具有高置信度,例如 0.92。
我需要在 SpeechRecognitionEngine 对象或每个 Grammar 对象中设置什么来避免这个问题吗?
我正在使用 c# 和 System.Speech.Recognition 来加载我定义的几个简单语法。当我说出与语法匹配的短语时,引擎以大约 0.95 的置信度正确识别语法。
但是,当我发音甚至不在语法中的单词(甚至来自不同的语言或乱码)时,引擎会随机返回一个匹配的语法,其中随机文本从未发音并且仍然具有高置信度,例如 0.92。
我需要在 SpeechRecognitionEngine 对象或每个 Grammar 对象中设置什么来避免这个问题吗?
我想我找到了一个适合我的解决方案,但如果存在,找到一个更优雅的解决方案仍然会很好:
我定义了一个听写语法和一个“占位符”。然后我加载我的语法并立即禁用它们。
using System.Speech.Recognition;
...
private DictationGrammar dictationGrammar;
private Grammar placeholderGrammar;
private List<Grammar> commands;
public void Initialize()
{
dictationGrammar = new DictationGrammar();
recognizer.LoadGrammarAsync(dictationGrammar);
var builder = new GrammarBuilder();
builder.Append("MYPLACEHOLDER");
placeholderGrammar = new Grammar(builder);
recognizer.LoadGrammarAsync(placeholderGrammar);
commands = new List<Grammar>();
foreach (var grammar in grammarManager.GetGrammars())
{
commands.Add(grammar);
grammar.Enabled = false;
recognizer.LoadGrammarAsync(grammar);
}
}
然后在speechRecognized 事件上,我放置了如果占位符被识别则启用命令的逻辑。如果识别出命令,则重新启用听写并禁用所有命令:
private async void speechRecognized(object sender, SpeechRecognizedEventArgs e)
{
if (e.Result.Grammar == placeholderGrammar)
{
//go to command mode
placeholderGrammar.Enabled = false;
dictationGrammar.Enabled = false;
foreach (var item in commands)
item.Enabled = true;
}
else if (commands.Any(x => e.Result.Grammar == x))
{
Do_something_with_recognized_command("!!");
//go back in normal mode
placeholderGrammar.Enabled = true;
dictationGrammar.Enabled = true;
}else {//this is dictation.. nothing to do}
}