问题标签 [microsoft-speech-platform]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
speech-recognition - 如何使用cortana将语音转换为文本并将该文本保存到文本文件中?
我有嵌入cortana的应用程序。我想这样做,让 cortana 连续识别并将该语音转换为文本。它还将该文本保存到文本文件中。我不想要实际的编码,但我想要一个完美的流程来做到这一点。有没有人提供流程图或一些链接对我的项目有帮助?
windows-10 - Microsoft 语音识别默认值与 API
所以我一直在 Windows 10 中使用 Microsoft Speech Recognition,进行培训练习,将文本口述到 Wordpad 中并进行更正,将单词添加到字典中等等。我想使用该软件来转录 .wav 文件。似乎可以使用 Windows Speech Recognition API 来做到这一点,但这似乎涉及创建和加载自己的语法文件,这向我表明这基本上会创建一个新的语音识别器,它使用相同的构建块但不同当我在开始菜单中单击“开始语音识别”时运行的程序。特别是,由于训练或配置的差异,它的表现会有所不同。
我错了吗?如果我不是,是否还有一种方法可以检索默认语音识别器使用的所有数据,以便我可以准确地重现它的行为?如果我需要使用自己的语法文件和单独的训练历史等创建一个单独的语音识别器来转录 .wav 文件,那么就这样吧,但我想更好地了解这里发生了什么。
c# - 没有预定义语法的 C# 语音识别
我正在尝试将语音识别与 C# 应用程序一起使用,但这样我只能在输出中预测短语:
我可以像 Google Speech Recognition API 一样获得输出,识别语音,不存在的单词并给我输出,或者如果我可以使用带有 C# 的 Google Speech Recognition 会很高兴看到一些例子如何做到这一点?
c# - 使用 DictationGrammar 的 System.Speech.Recognition 准确性
你好,我正在尝试为 C# windows 应用程序找到免费且有用的语音识别。我试过System.Speech.Recognition; 但是如果没有预先录制短语或单词并且我想使用DictationGrammar有时我必须说 20 次相同的短语或单词,但 20 次我的识别结果是错误的。所以我并不是说它不能很好地工作,但它不适用于我的情况。因此,如果我能以某种方式使其更好地工作,请在这里需要您的帮助:
我在使用 Python 进行Google Speech Recognition之前尝试过,它至少正确率为 95%,足以说,这对我来说已经足够了,但显然如果我没有密钥,它就不能免费使用:
说 API 密钥仅用于 Chromium 开发,而不是在此列表中提问https://www.chromium.org/developers/how-tos/api-keys也许还有其他一些使用方法:
我也尝试使用 Bing Speech API,但似乎它仅用于这里的 XAML 应用程序msdn.microsoft.com/en-us/library/dn434606.aspx和msdn.microsoft.com/en-us/library/dn467592.aspx
然后我找到了这个工具列表,但似乎没有什么是免费的http://www.dmoz.org/Computers/Speech_Technology/Toolkits/
c# - 找不到所需 ID 的识别器。\r\n参数名称: 文化
我正在使用 microsoft 语音识别器[Microsoft.Speech.Recognition] 开发语音识别程序
当我运行这个程序时从接受的答案复制粘贴我在重新初始化对象“sre”时遇到异常
附加信息:未找到所需 ID 的识别器。
异常 - {“未找到所需 ID 的识别器。\r\n参数名称:区域性”}
开发环境
视窗服务器 2012 X86
视觉工作室 2015
MicrosoftSpeechPlatformSDK - 版本 11.0 X86
语音平台运行时
text-to-speech - 更改文本转语音的语言 Microsoft.Speech.Synthesis
我找到了如何更改性别、速率和音量,但我想知道是否可以更改 - 或者如果我可以设置能力更好 - 几种不同的语言可供选择用于Microsoft.Speech.Synthesis
文本到语音。我只是找不到有用的信息。
speech-recognition - C# WinForm App 的免费语音识别
我正在尝试为 C# Windows 窗体应用程序可执行文件找到免费的语音识别,它可以作为谷歌语音识别,识别并将绝对新词转换为文本。
我尝试使用 System.Speech.Recognition;不同的方式,但它适用于预先录制的命令,我无法获得这样的结果,例如它与 Python 的 Google Speech Recognition 一起使用,这至少是 95% 的正确结果,足以说,这很好,但显然,如果我没有密钥,它就不能免费使用,也不能在可执行文件中使用。
所以我想试试微软认知服务的 Bing Speech API,但找不到任何如何编码的例子,一些基本的例子。如果有人处理过这个工具,你能帮我弄清楚吗
c# - Microsoft 语音对象库错误:80040154 ASP.NET Web 窗体应用程序
我正在尝试将文本转语音用于 ASP.NET Web 表单应用程序using SpeechLib;
:
在 Reference Manager COM 我有三个版本的 Microsoft Speech Object Library
所以我刚刚添加了所有内容,但似乎 5.3.19915.00 不起作用,无论如何我可以打电话using SpeechLib;
但我收到错误:
mscorlib.dll 中出现“System.Runtime.InteropServices.COMException”类型的异常,但未在用户代码中处理
附加信息:检索具有 CLSID {Registry Key} 的组件的 COM 类工厂失败,原因是以下错误:80040154 未注册类(HRESULT 异常:0x80040154 (REGDB_E_CLASSNOTREG))。
microsoft-cognitive - 用于自定义语音服务的 NodeJs websocket 客户端
我想使用 Java、NodeJs、Go 等编程语言为自定义语音服务创建一个 websocket 客户端。我在哪里可以找到有关如何从头开始使用该 websocket 的一些技术信息(预期的消息、字段等)?我已经阅读了 CSS 文档,但它侧重于如何使用用于 C#、javaScript、Android 的 SDK 库。如果想为不同的语言创建自己的 SDK,我应该考虑什么?
提前致谢。
c# - System.Speech 识别字母和数字而不是单词或句子
我正在尝试使用 System.Speech 而不是单词或句子来基本识别字母和数字。我正在使用这篇文章的最佳答案中的代码示例。以下是我看到的一些奇怪的结果:
是否有不同的语法集,或者 GrammarBuilder 的一种方法可以让我将识别限制为只听一系列字母和数字?