问题标签 [speech-recognition]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
speech-recognition - 语音识别与编程
在编程方面,有没有人使用 Dragon Naturally speak 语音识别软件取得成功?
我想知道,因为我认为这比我用手打字要快得多,而且在我的 carpol 隧道上更容易。
我每天都在 Visual Basic 6 IDE、Visual Studio 2008 IDE + Team Explorer 中编程,写电子邮件,并通过 Windows Live IM 聊天。
我需要一个基于命令的界面,我可以在其中将语音命令绑定到击键、在拼写/说单词/说没有空格的单词之间切换等。
任何意见都非常感谢。
speech-recognition - 让 WAV 文件转录与 Sphinx4 一起工作
我已经在我的 Windows XP 系统上安装了Sphinx-4并设置了 JSAPI。我想将英语口语 WAV(或 MP3)文件转录为文本。
当我运行“WavFile”演示时 - 它运行成功。
但是,当我像这样传递自己的 wav 文件时:
我得到:
正在加载“jar:file:/C:/sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/WavFile.jar!/edu/cmu/sphinx/demo/wavfile/config.xml”中定义的识别器...
解码 jar:file:/C:/sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/WavFile.jar!/edu/cmu/sphinx/demo/wavfile/12345.wav 结果:一二三四五
似乎这个演示设置为加载和运行内部 wav 文件(“12345.wav”)或其他东西。
我已经阅读了文档,只是不知道如何设置“config.xml”,甚至不知道将其放置在哪个目录中。我只是想获得一个使用标准演示运行的简单概念证明。
所以,问题是:如何运行 Sphinx4 程序来转录 wav 文件?
谢谢。
string - 需要 Windows 语音识别脚本的帮助来复合字符串
下面的 Windows 语音识别命令强制语音识别引擎使用文字文本(“所有 76 个人支付 5 美元”)而不是默认文本(“所有 76 个人支付 5 美元”)。
我正在尝试调整此命令以删除单词之间的空格,以便我可以通过说出以下内容来使用语音进行编程:
我认为这可行的方法是使用正则表达式删除所选文本之间的空格。因此,在以下代码中:
而不是这样写:
我认为它需要使用其他一些正则表达式模式来提取单词之间的空格并将单词推送到新的输出中。
我不知道该怎么做。如果有人有建议,将不胜感激。
debugging - 如何从 WSR 中的备用面板输出推断调试信息
我有这个 Windows 语音识别 (WSRMacro) 脚本,它将多个单词组合成一个单词:
但是,在某些情况下会出现脚本中的错误,我不知道如何推断问题所在。尽管上面的示例有效,但以下示例无效:
替代面板不是像上面那样复合单词,而是出现以下提示:
我可以从上面的备用面板输出中推断出下面脚本中的任何特定错误吗?
或者有什么我可以添加到脚本中以获得关于错误性质的更有用的反馈?
c# - 如何在 Windows XP 上通过 C# 使用语音识别?+ 我需要训练每台运行应用程序的电脑吗?
我正在制作一个响应很少语音命令的机器人。我正在使用 Windows XP 和 C# 来实现这一点。我唯一的问题是我不知道如何在 C# 中使用语音识别。
我一直在搜索谷歌和 MSDN,但我还没有找到任何适合初学者的教程..
有什么建议么??
此外,我知道——根据我在 M$ word 中的 windows 语音识别经验——我需要在启动语音识别应用程序之前训练计算机。这可能会给我带来很大的问题,因为我可能需要使用不同的计算机来展示我的机器人/或/不同的人可能是演示者。那么有没有办法制作一个预定义的单词列表,任何用户都可以对应用程序说,而无需先训练它???
感谢帮助!
windows - Windows 中语音识别的自定义词汇表
使用 Windows7 语音识别,我希望创建专门的词汇表来识别我的部分应用程序中的特定领域的自然语言。因此,例如,一个特定的文本输入框可以链接到它自己的词汇表,并限制为一小部分语言,例如
where"troll"
在词汇表中,但"trawl"
不是。应用程序应该能够学习,所以:
应该允许"arggly"
拼写和识别并添加到字典中。
java - Java微版最好的语音识别库是什么?
jme最好的语音识别库是什么?
speech-recognition - 可以通过 SAPI 4 接口连接到 Naturally Speech 吗?
我在某处读到,您可以通过它导出的 SAPI 4 接口与 Naturally Speech 进行交互?这是真的吗?是否有任何文件?谢谢
java-me - J2ME 中的语音识别
我正在使用 j2me 开发移动应用程序。我需要有一个语音识别功能,这样应用程序应该能够处理用户给出的命令并采取行动。我想知道的是
这在技术上是否可行(我是 j2me 编程的新手)?
如果可能的话,我在哪里可以找到用于语音识别的 j2me 库?
提前致谢,
女娲
speech-recognition - 有没有在语音级别输出语音到文本的软件?
是否有任何软件能够获取音频文件并输出语音 (IPA) 文本?
我知道那里的大部分软件都将其直接转换为一种语言,但是有没有一种“可教”的软件?