问题标签 [microsoft-speech-api]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
458 浏览

python - Python Microsoft 语音 API 错误:来自 CmdLoadFromFile 的 SPERR_NO_DRIVER

这个问题很可能没有答案,但我非常希望能在这件事上得到一些帮助。我找到了一段用 Python 处理微软 Speech API 的代码,然后去了解了 W3C 的“ Speech Recognition Grammar Specification Version 1.0 ”。

我把它归结为:

据我了解,上述错误代码对应“SPERR_NO_DRIVER”,与“没有安装波形驱动程序”有关。

我现在被困住了。我不知道在这种情况下,wave driver 是什么,也不知道在哪里可以找到它或如何调试它等等......有什么想法吗?

0 投票
1 回答
595 浏览

grammar - 无法加载外部 ruleref Microsoft Speech Grammar

我正在使用 Microsoft Speech API 来执行语音识别。

一切都很好,直到我使用外部规则引用(根据http://msdn.microsoft.com/en-us/library/hh361619

工作正常,但如果我用外部文件替换 ruleref,识别器会在 RecognizeCompleted 事件上循环并且似乎匹配任何东西。

  • 我试图引用一个非常简单的文件
  • 我试图参考 cmnrules.cfg
  • 我尝试设置绝对路径
  • 文件上升解析错误如果我输入错误
  • 如果我像 other2.xml 这样在 ruleref 中输入错误的值,它仍然会循环

C#code 在这里 l.75: https ://github.com/JpEncausse/WSRMacro/blob/master/WSRMacro/WSRMacro.cs

我认为它没有找到由 ruleref 定义的文件。

  • 它是否在相对路径中搜索?
  • 有没有办法设置默认语法目录?
0 投票
2 回答
2885 浏览

grammar - 在 Microsoft 语音语法中匹配通配符/听写

我正在使用 Microsoft Speech API 加载 grxml 语法:

基于 MSDN,我找不到与通配符/口语文本匹配的标签,例如:

似乎可以使用带有 DictationGrammar 和 appendDictation() 的代码。WSMacro XML 也可以使用 * 但我不知道如何在 XML 中做到这一点?

跳过文本,但我需要识别它。

我错过了什么吗?

0 投票
1 回答
1178 浏览

sdk - 将印地语或卡纳达语用于 microsoft speech sdk

Microsoft Speech SDK 中是否有任何可用的印地语或卡纳达语语言包。印地语和卡纳达语是印度使用的语言。

0 投票
1 回答
1866 浏览

.net - Microsoft 语音识别:具有置信度分数的替代结果?

我是使用 Microsoft.Speech 识别器(使用 Microsoft Speech Platform SDK 版本 11)的新手,我试图让它从一个简单的语法输出 n 最佳识别匹配,以及每个的置信度分数。

根据文档(以及在对这个问题的回答中e.Result.Alternates提到的),除了得分最高的单词之外,应该能够使用它来访问已识别的单词。但是,即使将置信度拒绝阈值重置为 0(这应该意味着什么都不会被拒绝),我仍然只得到一个结果,并且没有替代(尽管SpeechHypothesized事件表明至少其他单词中的一个似乎确实被识别为 non - 在某些时候置信度为零)。

我的问题:任何人都可以向我解释为什么我只得到一个识别词,即使置信度拒绝阈值设置为零?如何获得其他可能的匹配项及其置信度分数?我在这里想念什么?

下面是我的代码。提前感谢任何可以提供帮助的人:)


在下面的示例中,识别器被发送一个单词“news”的 wav 文件,并且必须从相似的单词(“noose”、“newts”)中进行选择。我想提取每个单词的识别器置信度得分列表(它们都应该不为零),即使它只会返回最好的一个(“新闻”)作为结果。

这给出了以下输出:

我还尝试为每个单词使用一个单独的短语(而不是一个具有三个选项的短语),甚至为每个单词/短语使用单独的语法来实现这一点。结果基本相同:只有一个“替代品”。

0 投票
0 回答
149 浏览

microsoft-speech-platform - 如何设置语音识别的输入设备

是否有可能在 Windows 8 和 Windows Server 2012 机器上使用 System.Speech 或 Microsoft.Speech 设置另一个麦克风输入而不是系统默认值来识别语音?

我浏览了文档,但没有找到明显的方法。但也许有一种解决方法,或者我错过了什么?

0 投票
3 回答
1302 浏览

system.speech.recognition - 锁定计算机会禁用 Windows 8.1 上的语音识别

我在 inproc 模式下SpeechRecognitionEngine使用命名空间System.Speech来完成一些自动化工作。语音识别通过 启动RecognizeAsync

它工作正常,但是,当计算机被锁定时,语音识别停止。一旦计算机被解锁,识别就会再次激活。虽然这对于大多数应用程序来说可能是一个有意义的行为,但对我来说,这是一个问题。我在网上搜索过,但没有找到禁用此行为的解决方案。

如何将 SpeechRecognition 参数化为在计算机锁定时不停止?

(请注意:该应用程序是传统的 Windows WPF 应用程序,而不是 Windows 应用商店应用程序)

0 投票
1 回答
3108 浏览

c# - 加载 Microsoft Speech SDK v11 时出错

我已经安装了 x86 SDK 并将 Microsoft.Speech.dll 添加到我的项目中。项目设置为 x86。

当试图创建一个SpeechSynthesizer我得到的实例时

由于以下错误,检索具有 CLSID {D941651C-44E6-4C17-BADF-C36826FC3424} 的组件的 COM 类工厂失败:80040154 未注册类(HRESULT 异常:0x80040154 (REGDB_E_CLASSNOTREG))。

还有什么会导致那些错误的目标平台?

0 投票
0 回答
382 浏览

c# - 如何为微软语音识别器创建语言

我正在使用 Microsoft Speech API 在 C# 中开发语音识别应用程序。我需要以下语言的语音识别器:

  • 乌兹拉特语-UZ

该语言不存在语音识别语言。所以我想为这种语言创建自己的轻量级语音识别语言。

我怎样才能做到这一点?

0 投票
2 回答
387 浏览

c# - C# Visual Studio 2012 Speech to textBox1

I got a problem with the Speech API. I'm working with commands, thats working fine, but when I want the speech to be seen in the textBox1 it wont show it.

This is the code I need help with. Im working with a switch case. I tried several if statement, but none works.

Each time I say listen, only 'listen' comes visible in the textBox

Here is the full code:

EDIT:

I need help with this piece of the code:

When I say 'listen', AI follows up with "I am listening". After that it should be placing the text im saying into the microphone in the textbox1, but it doesnt. It only places 'listen' in it.

Everything else works fine!