问题标签 [speech-recognition]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
4 回答
1256 浏览

usability - 可用性:语音识别与键盘

我们看到越来越多的语音识别被实现,并且需要能够进行良好语音识别的库。与键盘或小键盘相比,它背后的基本原理(在可用性方面)是什么?你有什么理由投资这个开发项目?

例如,让我们以呼叫中心为例。几年前,几乎每个呼叫中​​心都使用提示输入菜单键的 IVR。现在,我们看到越来越多的菜单提示输入关键字和/或按下键盘:“请说出发票或按 1 查看您的发票”。或者我们在公司的电话簿中看到同样的内容:“请说出您要联系的人的姓名”……“弗兰克·洛伊德”……“你说的是杰克·弗洛伊德吗?如果你愿意,请说是联系此人或拒绝重试”。

我想当你在车里而不拿着手机时这是一个加分,但值得额外的等待时间吗?所有选项的交互时间更长,尝试分析是否有人说了什么时的提示时间更长等等?此外,可靠性肯定比以前更好,但有时感觉更像是某人决定插入系统的玩具,因此它可以让人感觉未来感。

有设计 IVR 或使用(或选择不使用)语音识别的软件的经验吗?

谢谢!

0 投票
5 回答
3609 浏览

speech-recognition - “语音触发”检测

我有一个语音应用程序,如果能够使用“触发词”开始录制音频,它将会大大改进。我不需要完整的语音文本引擎,只需要可靠/有效地检测触发词的能力。

我想知道是否有任何专门的语音引擎支持这个特定的用例,或者有任何库/方法来开发这种单一用途的检测引擎。理想情况下,我希望它可以在嘈杂的环境中工作,但可以针对单个用户的声音进行训练。

指向研究论文/主题的指针也将不胜感激,所以我知道要问什么。

0 投票
4 回答
21900 浏览

iphone - iPhone App › 添加语音识别?

我想构建一个使用语音识别的应用程序。我见过像谷歌这样的大公司实现了这个功能,但我很好奇在初创阶段做这件事。有人调查过这个吗?我们有什么工具可以做到这一点吗?

0 投票
2 回答
1107 浏览

delphi - 语音识别效果不佳

我关注了一篇关于使用 Delphi 进行语音识别(SAPI 5.3)的文章。

http://edn.embarcadero.com/article/29583

我创建了一个基本应用程序。但问题是应用程序搞错了!它没有得到我所说的正确。例如,如果我说:“word”,它会得到“ward”。等等。

有没有更好的方法来做语音识别任何人都可以给我?

0 投票
1 回答
5297 浏览

c# - 从音频文件而不是麦克风进行语音识别

如何对来自音频文件(.mp3、wav)而不是麦克风的语音执行语音识别?

我希望能够从 C#.NET 和 Delphi 中做到这一点。

0 投票
3 回答
1945 浏览

c# - 使用 C# 中的语音识别

我正在尝试编写一个通过自定义(专业)语法支持语音识别的程序。但是,SpeechRecognized 事件永远不会触发,并且语音识别小程序的行为就像语法不存在一样。

这是我的精确步骤。请告诉我哪里出错了。

  1. 打开控制面板,搜索“语音”,然后点击“开始语音识别”。
  2. 打开 Visual C#,新建一个 Windows 窗体项目
  3. 将此 Stack Overflow 问题的第一个答案中的代码复制并粘贴到项目中。
  4. 添加对 System.Speech 的必要引用。
  5. 运行程序,语音识别小程序仍在运行。
  6. 说“开始听”。
  7. 说出一个 1 到 100 之间的数字。

标签的文本永远不会改变其默认值(“label1”),因此似乎永远不会调用 rec_SpeechRecognized(),即 SpeechRecognized 事件永远不会触发。如果我在开始菜单中说出一个听起来与打开的窗口或程序名称有些相似的数字,它会问我是否是这个意思。它似乎与我刚刚定义的自定义语法完全无关。

我尝试了很多我在网上找到的示例,这些示例都与我链接到的答案中的示例几乎相同,只是语法不同。我对所有这些都得到了相同的结果,所以我认为我一定做错了什么。

我究竟做错了什么?

0 投票
1 回答
406 浏览

flash - 从 Flash 使用 Adob​​e CS4 语音分析

Adobe Premier 能够将口语(视频音轨)转录为文本。是否可以从 flash 或 flex 中使用此模块?我想通过口语来控制网络应用程序(使用网络摄像头麦克风)。

0 投票
21 回答
2178 浏览

algorithm - 为什么语音识别没有进步?

算法设计者难以解决的这个主题有什么困难?

真的有那么复杂吗?

我很难理解为什么这个话题如此成问题。谁能给我一个例子说明为什么会这样?

0 投票
4 回答
4261 浏览

iphone - iPhone 上的语音识别

我需要开发一个识别语音的 iPhone 应用程序,并根据结果执行进一步的任务。

我知道 iPhone 3.0 不支持语音识别,我需要在服务器端实现语音识别软件。我只知道这件事,因为我是新手,所以我不知道如何处理。

意思是我需要在服务器端购买和实施哪些软件,以及如何使用该服务?

0 投票
1 回答
1145 浏览

delphi - 以文件为输入的语音识别

可能重复:
来自音频文件而不是麦克风的语音识别

有人如何使用文件(.wav 或 .mp3)作为输入并使用 Delphi 执行语音识别?

我想使用音频文件而不是麦克风作为输入。