问题标签 [microsoft-speech-platform]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c# - 微软语音识别平台
我在 C# 中使用 System.Speech 编写了一个用于语音识别的应用程序,该应用程序在 Windows 7 上运行良好。但是我在创建可以在 Windows 2003 (x86) 上运行的相同应用程序之后。
我的编程环境:Windows 7 x64 Pro Visual Studio 2008
为了在我的编程环境中开发这个应用程序,我安装了:
1.Microsoft 语音平台 - 服务器运行时(版本 10.1)(x86)
2.微软语音平台-软件开发工具包(SDK)(10.1版)(x86)
3.Microsoft Speech Platform - 服务器运行时语言(版本 10.1)
(此处为 en-GB 安装了 SR)
在我的程序中,我使用了 Microsoft.Speech.Recognition 而不是 System.Speech;
从 SDK 文档中粘贴此代码:
我还在项目属性中将平台目标设置为 x86。代码可以编译,但是一旦我运行或调试它就无法识别。知道我错过了什么吗?
speech-recognition - 无法在 Win 7 x64 上正确安装 MS Speech Platform 11
所以我正在尝试为 TTS 和 SR 启动并运行 MS Speech Platform 11 + SDK + Russian Language
- 安装 SpeechPlatformRuntime.x64.msi
- 安装 MicrosoftSpeechPlatformSDK.x64.msi --- 两者都转到正确的“程序文件”文件夹。
- 安装 MSSpeech_SR_ru-RU_TELE.msi
- 安装 MSSpeech_TTS_ru-RU_Elena.msi --- 两者都进入“Program Files (x86)”文件夹。- 可以吗?
似乎没有,因为当我查看 SpeechRecognitionEngine.InstalledRecognizers() 它返回 2 项:
但我从未安装过这个识别器。我查看了 Win 7 组件,但找不到与此相关的任何内容。
所以问题是:
- 是否需要在 x64 程序文件中安装语言?如果是这样,该怎么做?
- 如何配置识别器和合成器以查看 ru-RU 语言?
非常感谢任何帮助。
speech-recognition - Microsoft 语音平台 - 采样率和位深度
如果音频的采样率和位深度与系统的训练数据匹配,则识别结果最好。
那么,有没有人知道 Microsoft Speech Platform 中使用的确切采样率和/或位深度(和/或立体声/单声道)(如果这很重要,是最新的)?如果是这样,你还记得你是从哪里得到这些信息的吗?
请注意,我使用的是 MS Speech Platform,而不是 SAPI。除非两者都使用相同的训练数据,否则这不是相同的 AFAIK。准确地说 - 我使用这个:http: //msdn.microsoft.com/en-us/library/microsoft.speech.recognition.speechrecognitionengine.setinputtowavefile%28v=office.14%29.aspx
我的第一次尝试是基于页面上给出的 C++ 代码示例。
text-to-speech - 如何使用 Microsoft Speech SDK 11 语言包?
我想使用具有不同声音的 MS Speech SDK 11,而不仅仅是 Microsoft Anna。我下载了语言包并安装了其中一些,但它们尚不可用。请问如何使用 MS Speech SDK 11 使用不同的语言?
c# - 使用微软语音识别引擎进行音频比较
我有一个应用程序,用户可以在其中说话和一个词,他将获得他所说的词的准确百分比。即引擎识别这个词的程度。
这一切都很好,但我有一个难题,需要将哪些单词添加到字典中,我将作为字典提供给识别引擎。
如果我为 case pen 给出以“p”开头的单词,那么像 pendant、pent 等所有单词都将被添加到字典中。在这种情况下,我没有得到识别为“pen”的单词。
相反,我总是得到其他词,如“吊坠”等
但是,如果我只在字典中添加有限的单词,例如“pe”、“pen”,那么对于同一个录制文件,我只能将识别的单词作为“Pen”。
意味着它显然取决于我们提供给字典的单词。
我已经向我的客户传达了同样的信息。但是他们想要的是,对于给定的输入词,他们也可以说出错误的词,所以当时他们不需要获得准确性并获得识别的文本。
我已经为这个问题做了我本可以做的事情。但是我的客户需要宇宙之外的东西。
代码 :
有没有专家在这里解决这个问题?任何帮助将不胜感激。
谢谢
c# - 为 Microsoft 语音识别引擎创建声学模型
是否可以像我们为 CMU Sphinx 一样为 Micorosoft 语音识别引擎创建声学模型
CMUSphinx 链接: http ://cmusphinx.sourceforge.net/wiki/tutorialadapt
我进行了一些搜索,但没有找到合适的答案或解决方案。
谁能指出我正确的方向。
谢谢
c# - 教授 Microsoft.Speech Engine 一些非英语单词的发音
我正在使用依赖语音输入的 Kinect 开发 ac# 应用程序。我有一个阿拉伯语单词列表,用户可以说这些单词来选择不同的菜单项。
过去几天我一直在寻找,但收效甚微。我发现的东西:
CMU Sphinx:http ://www.ccse.kfupm.edu.sa/~elshafei/AASR.htm 第一个问题是它是基于java的。我已经查看了 KVM 和桥接器,但我无法在这件事上走得太远。我无法将其设置为在 Java 中工作。没有关于如何使用已经准备好的文件的步骤。
我还查看了使用此链接建议的 SRGSdocument在 Microsoft Speech API 中指定单词的发音, 但这对于我的目的来说太复杂了,我什至不知道它是否是我需要的。
我还查看了Microsoft Speech Recognition Custom Training 这个人的问题很相似,但我无法以同样的方式解决我的问题。
我无法使用 Sakhr 等商业应用程序,因为我没有预算。简单地将单词添加到语法中是行不通的,因为这些单词不符合英语的正常发音规则。
基本上,我正在寻找的是某种工具,它可以将用英语编写的单词与来自麦克风的一组不同发音(如预训练)连接起来,然后可以在运行时由语音引擎引用。这可能吗?
我愿意接受任何选择。
谢谢。
.net - Microsoft 语音识别:具有置信度分数的替代结果?
我是使用 Microsoft.Speech 识别器(使用 Microsoft Speech Platform SDK 版本 11)的新手,我试图让它从一个简单的语法输出 n 最佳识别匹配,以及每个的置信度分数。
根据文档(以及在对这个问题的回答中e.Result.Alternates
提到的),除了得分最高的单词之外,应该能够使用它来访问已识别的单词。但是,即使将置信度拒绝阈值重置为 0(这应该意味着什么都不会被拒绝),我仍然只得到一个结果,并且没有替代(尽管SpeechHypothesized
事件表明至少其他单词中的一个似乎确实被识别为 non - 在某些时候置信度为零)。
我的问题:任何人都可以向我解释为什么我只得到一个识别词,即使置信度拒绝阈值设置为零?如何获得其他可能的匹配项及其置信度分数?我在这里想念什么?
下面是我的代码。提前感谢任何可以提供帮助的人:)
在下面的示例中,识别器被发送一个单词“news”的 wav 文件,并且必须从相似的单词(“noose”、“newts”)中进行选择。我想提取每个单词的识别器置信度得分列表(它们都应该不为零),即使它只会返回最好的一个(“新闻”)作为结果。
这给出了以下输出:
我还尝试为每个单词使用一个单独的短语(而不是一个具有三个选项的短语),甚至为每个单词/短语使用单独的语法来实现这一点。结果基本相同:只有一个“替代品”。
.net - 加载语法时语音识别引擎超时 (Microsoft.Speech)
我正在使用Microsoft.Speech.Recognition
并且需要使用相当大的语法来完成识别任务。因此,我创建并稍后将语法修改为 a SrgsDocument
,然后Grammar
从中构造一个对象。此时,我将语法加载到引擎中,以准备使用该SpeechRecognitionEngine.LoadGrammar
方法进行识别。
换句话说,我有类似的东西:
在这一点上,加载语法,几分钟后我有时(并非总是,并且不是真正作为语法大小的函数)收到错误“任务无法完成,因为 SR 引擎已超时。”
如果我捕捉到异常并尝试再次将相同的语法加载到同一个引擎中,有时它会成功加载(尽管非常缓慢),有时它会再次给出相同的错误。
这是什么原因造成的?为什么有时会超时,有时会使用相同的语法/引擎?
我能做些什么来加快语法加载速度吗?
任何想法都会非常感激。
microsoft-speech-platform - 如何设置语音识别的输入设备
是否有可能在 Windows 8 和 Windows Server 2012 机器上使用 System.Speech 或 Microsoft.Speech 设置另一个麦克风输入而不是系统默认值来识别语音?
我浏览了文档,但没有找到明显的方法。但也许有一种解决方法,或者我错过了什么?