问题标签 [microsoft-speech-api]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
grammar - 仅在 SRGS 语法中按前缀检测单词
我正在使用 SRGS 语法来优化 Microsoft Speech STT 服务的准确性。我对这种语法有特定的需求,因为我希望它仅通过前缀匹配某些单词,但通过检测获得整个单词。
这是我尝试过的那种规则:
<rule id='test'>
<item>
contain<ruleref uri="grammar:dictation" type="application/srgs+xml"/>
</item>
</rule>
我希望这条规则匹配以下内容:“包含”、“包含”、“包含”
问题是我在声音检测中得到的唯一东西是:“包含和”,“包含他”
这一定是因为我不能同时拥有纯文本(“包含”)和定义单个单词的听写标签。STT 假设这些将是 2 个单独的单词并相应地调整识别结果。
在我的情况下,引用语法的ruleref
标签:听写是必要的,因为如果我改用“垃圾”特殊规则之类的东西,我想我将无法获取整个单词。
任何提示或想法将不胜感激,恐怕在当前的 SRGS 状态下,我正在尝试做的事情可能是不可能的。
speech-recognition - Microsoft Speech SDK 5.4 可以识别俄语吗?
我正在尝试创建一个可以识别俄语语音的语音到文本应用程序。但我不知道 Microsoft Speech SDK 5.4 中对俄语的支持。
你能告诉我这件事吗?
c# - 为 c# microsoft 2013 安装 Microsoft.speech
于是我在这个地址下载了微软语音sdk http://www.microsoft.com/en-us/download/details.aspx?id=27226
我运行了安装程序,但无法弄清楚如何在 Visual Studio 中引用它,以便我可以使用 Visual Studio 2013 将它包含在我的 C# 程序中
提前致谢!
c# - 尝试创建一些简单的 System.Speech.Recognition 语法时崩溃
嗨,我正在尝试解析语音所说的时间:
但是我在 mscorlib.dll 中遇到了“System.ArgumentOutOfRangeException”类型的异常(附加信息:索引超出范围。必须为非负数且小于集合的大小。)。查看上层堆栈:
我已经尝试过 .NET 3.0 和 4.5 - 结果相同。还尝试了 2 台机器 - 都是 x64。
有任何想法吗?
speech-recognition - System.speech 应用程序的系统要求
我正在使用 microsoft System.speech 识别引擎为我的大学学位做一个愚蠢的小项目。我想知道运行这种软件的最低要求是什么。谢谢。
c# - 如何在 C# 中更新 srgs 语法
我已经为语义识别创建了 srgs 文件,现在我想更新 myGrammar 文件,现在如何更新 my_Grammar.xml 文件并从文本框中的项目标签中添加更多城市。关于这方面的帮助材料将不胜感激并提前致谢。
windows - Microsoft SAPI 子语言问题
我的问题是:当 Windows 10 显示语言设置为英语(英国)时,我的 SAPI inproc 识别器拒绝加载我的语法文件。
系统显示语言设置为英国。语音识别语言是英国。系统区域设置为英国。SAPI xml-format Grammar 甚至指定 LANGID=809 - 据我所知,一切都设置为 EN-GB,但语法仍然无法加载。
但是当显示语言设置为英语(美国)时,它可以正常加载和工作。
有谁知道这是怎么回事?这非常令人沮丧......希望我只是错过了一些简单的东西。
SAPI 初始化代码:
每当显示语言不是英语(美国)时,我都会收到“无法加载语法。请检查语言设置”错误,即使我确认所有设置都匹配......
真的很感激比我知识渊博的人的任何见解。
法利
c# - 在 Azure 上调用 SpeechAPI 以实现文本转语音
我在本地服务器上运行了以下非常基本的 TTS 代码
此代码依赖于 System.Speech,我在 VS 2015 项目中为此添加了参考。工作正常,但根据我的阅读和尝试,我知道当代码托管在 Azure 上时,这将不起作用。我已经阅读了几篇关于 SO 查询的帖子是否真的可以在 azure 上进行 TTS。当然,在 2 年前,这似乎是不可能的。如何在 Windows azure 网站上获取 System.Speech?
所有的道路似乎都通向 Microsoft Speech API https://azure.microsoft.com/en-gb/marketplace/partners/speechapis/speechapis/ 我已经注册并获得了用于调用此 API 的私钥和 sec 密钥。然而我的问题是这个。我如何实际调用 SpeechAPI?我必须在上面的简单代码示例中进行哪些更改,以便在 azure 上运行时可以正常工作?
windows-10 - Microsoft 语音识别默认值与 API
所以我一直在 Windows 10 中使用 Microsoft Speech Recognition,进行培训练习,将文本口述到 Wordpad 中并进行更正,将单词添加到字典中等等。我想使用该软件来转录 .wav 文件。似乎可以使用 Windows Speech Recognition API 来做到这一点,但这似乎涉及创建和加载自己的语法文件,这向我表明这基本上会创建一个新的语音识别器,它使用相同的构建块但不同当我在开始菜单中单击“开始语音识别”时运行的程序。特别是,由于训练或配置的差异,它的表现会有所不同。
我错了吗?如果我不是,是否还有一种方法可以检索默认语音识别器使用的所有数据,以便我可以准确地重现它的行为?如果我需要使用自己的语法文件和单独的训练历史等创建一个单独的语音识别器来转录 .wav 文件,那么就这样吧,但我想更好地了解这里发生了什么。
delphi - 如何在带有 Delphi XE2 或更高版本的 Windows 10 中使用 SpeechAPI5.*?
我在 Delphi XE2 中有SpeechAPI 5.4的示例。这是其中的一部分:
此代码适用于从 XP 到 8.1 的所有 Windows。不幸的是,Windows 10 引发了异常。在日志文件中,我可以阅读:
标准 Windows 文本转语音工具向我显示了 2 个可用的声音:
动态创建很重要TSpVoice
。
我如何才能毫无例外地处理所有声音?