问题标签 [speech-recognition]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

5058 问题

0 投票

4 回答

1256 浏览

usability - 可用性：语音识别与键盘

我们看到越来越多的语音识别被实现，并且需要能够进行良好语音识别的库。与键盘或小键盘相比，它背后的基本原理（在可用性方面）是什么？你有什么理由投资这个开发项目？

例如，让我们以呼叫中心为例。几年前，几乎每个呼叫中心都使用提示输入菜单键的 IVR。现在，我们看到越来越多的菜单提示输入关键字和/或按下键盘：“请说出发票或按 1 查看您的发票”。或者我们在公司的电话簿中看到同样的内容：“请说出您要联系的人的姓名”……“弗兰克·洛伊德”……“你说的是杰克·弗洛伊德吗？如果你愿意，请说是联系此人或拒绝重试”。

我想当你在车里而不拿着手机时这是一个加分，但值得额外的等待时间吗？所有选项的交互时间更长，尝试分析是否有人说了什么时的提示时间更长等等？此外，可靠性肯定比以前更好，但有时感觉更像是某人决定插入系统的玩具，因此它可以让人感觉未来感。

有设计 IVR 或使用（或选择不使用）语音识别的软件的经验吗？

谢谢！

2009-05-22T15:13:32.703

0 投票

5 回答

3609 浏览

speech-recognition - “语音触发”检测

我有一个语音应用程序，如果能够使用“触发词”开始录制音频，它将会大大改进。我不需要完整的语音文本引擎，只需要可靠/有效地检测触发词的能力。

我想知道是否有任何专门的语音引擎支持这个特定的用例，或者有任何库/方法来开发这种单一用途的检测引擎。理想情况下，我希望它可以在嘈杂的环境中工作，但可以针对单个用户的声音进行训练。

指向研究论文/主题的指针也将不胜感激，所以我知道要问什么。

speech-recognition signal-processing voice voice-recording

2009-05-23T17:03:20.017

0 投票

4 回答

21900 浏览

iphone - iPhone App › 添加语音识别？

我想构建一个使用语音识别的应用程序。我见过像谷歌这样的大公司实现了这个功能，但我很好奇在初创阶段做这件事。有人调查过这个吗？我们有什么工具可以做到这一点吗？

iphone speech-recognition voice-recording speech-to-text

aaron

2009-06-02T22:50:41.050

0 投票

2 回答

1107 浏览

delphi - 语音识别效果不佳

我关注了一篇关于使用 Delphi 进行语音识别（SAPI 5.3）的文章。

http://edn.embarcadero.com/article/29583

我创建了一个基本应用程序。但问题是应用程序搞错了！它没有得到我所说的正确。例如，如果我说：“word”，它会得到“ward”。等等。

有没有更好的方法来做语音识别任何人都可以给我？

delphi artificial-intelligence speech-recognition

2009-06-27T17:12:46.423

0 投票

1 回答

5297 浏览

c# - 从音频文件而不是麦克风进行语音识别

如何对来自音频文件（.mp3、wav）而不是麦克风的语音执行语音识别？

我希望能够从 C#.NET 和 Delphi 中做到这一点。

c#.net delphi speech-recognition

2009-06-28T17:38:30.607

0 投票

3 回答

1945 浏览

c# - 使用 C# 中的语音识别

我正在尝试编写一个通过自定义（专业）语法支持语音识别的程序。但是，SpeechRecognized 事件永远不会触发，并且语音识别小程序的行为就像语法不存在一样。

这是我的精确步骤。请告诉我哪里出错了。

打开控制面板，搜索“语音”，然后点击“开始语音识别”。
打开 Visual C#，新建一个 Windows 窗体项目
将此 Stack Overflow 问题的第一个答案中的代码复制并粘贴到项目中。
添加对 System.Speech 的必要引用。
运行程序，语音识别小程序仍在运行。
说“开始听”。
说出一个 1 到 100 之间的数字。

标签的文本永远不会改变其默认值（“label1”），因此似乎永远不会调用 rec_SpeechRecognized()，即 SpeechRecognized 事件永远不会触发。如果我在开始菜单中说出一个听起来与打开的窗口或程序名称有些相似的数字，它会问我是否是这个意思。它似乎与我刚刚定义的自定义语法完全无关。

我尝试了很多我在网上找到的示例，这些示例都与我链接到的答案中的示例几乎相同，只是语法不同。我对所有这些都得到了相同的结果，所以我认为我一定做错了什么。

我究竟做错了什么？

c#speech-recognition

2009-06-29T18:19:19.280

0 投票

1 回答

406 浏览