问题标签 [voice]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
15 回答
3367 浏览

voip - 您的交互式语音响应平台是什么?

对于那些在语音领域工作的人,您使用什么作为 IVR 平台?我正在使用 Microsoft Speech Server 2007。有哪些等效软件包?是否有人使用开源软件来处理呼入或呼出电话?请注意,我不只是在谈论语音识别,它是一个综合包的一个组成部分。IVR 平台将包括语音识别、文本到语音、VUI 技术(如 VoiceXML)以及通过 SIP 或电话硬件的呼叫终止。

0 投票
16 回答
20676 浏览

speech-recognition - 面向开发人员的语音识别软件

好吧,医生终于说出来了,我需要在手腕上放松几个月。由于我是一名 .NET 开发人员,这可能会暂时结束我的生计,我并不急于这样做。也就是说,开发人员有什么好的免提选项吗?有人成功使用了任何语音识别软件吗?

后记:我的手臂再次恢复到双手编程不成问题的程度。Dragon 自然地运行良好,但速度较慢,不像键盘那样我编程的速度比我想象的要快。

0 投票
2 回答
5918 浏览

python - 如何从输入音频流中提取频率信息(使用 PortAudio)?

我想使用PortAudio(PyAudio)录制声音(语音)并在屏幕上输出相应的声波。像我一样绝望,我无法从音频流中提取频率信息,以便我可以以赫兹/时间的形式绘制它。


这是一个示例代码片段,它记录和播放录制的音频五秒钟,以防它有帮助:

我希望从上述变量“数据”中提取所需的信息。(或者使用 PortAudio 或其他带有 Python 绑定的库的其他高级方法。)


我将非常感谢任何帮助!即使是模糊相关的音频分析智慧的花絮也受到赞赏。:)

0 投票
3 回答
14966 浏览

browser - 如何在浏览器中录制语音?

我需要用户在浏览器上录制他们的声音,然后自动将生成的 mp3 上传到网络服务器。

我在想用户按下一个大胖开始记录/停止记录按钮来做到这一点。

然后,这会将文件保存在用户硬盘上。然后它将被有效地压缩并自动 ftp'​​d 到一个网站。

是否可以使用 ActiveX 或 Java 来做到这一点?或者有没有图书馆可以提供帮助?

该应用程序适用于可以在需要时安装软件的用户,因此可以安装 exe 或其他任何东西。

任何建议都非常感谢。

0 投票
2 回答
3190 浏览

python - Python 中的视频和语音聊天可操作性

我正在尝试在 Python 中查找有关视频和语音聊天可操作性的资源......有人知道一些好的资源或示例项目吗?

任何帮助将不胜感激!

0 投票
1 回答
476 浏览

voice - VXML从变量中获取子对话框的'src'

我们的业务正在从旧的 ASP 系统过渡到更新的 ASP.NET 系统,包括对我们的数据库进行大量改进。将会有一段共存的时期,在此期间,新旧将并存。

一个需要共存的应用程序是我们使用的语音邮件系统。它的工作原理如下:

  1. 用户来电。
  2. 用户输入帐号。
  3. 用户记录该帐户的消息。
  4. 用户可以选择重新录制、接受或丢弃。

在共存期间,正在修改现有应用程序。当用户输入已转换为新系统(使用不同的识别号码)的帐号时,我们希望无缝地允许他们继续。帐户验证系统当前正在返回帐户名称、帐号和(用于共存)到正确记录页面的路径。

一旦用户记录了一条消息并接受它(或挂断),我们就会触发一个子对话框来将消息记录到我们的数据库中。

如何修改子对话框调用以接受变量的内容作为 src?

0 投票
1 回答
410 浏览

voice - VXML 在录制超时时发出哔声

我在上一个问题中提到的 VXML 应用程序现在正在测试中。在允许用户录制消息(最长 5 分钟)后,我们进入标准菜单(提交、播放、重新录制等)。

我们的一个测试人员,厌倦了任何事情并且厌倦了留下 5 分钟的消息,正在阅读我们发送的电子邮件,其中包括电话号码。菜单刚开始,她就说“两个”,只听到了菜单的一瞬间。

不用说,她很困惑。

对我来说,解决这个问题的正确方法似乎是在录音中添加一个明确的停止,就像开始它的哔哔声一样。

记录项有一个 beep 属性,它在记录开始时发出哔声,我们使用它。我找不到对用户达到最大时间时会发出哔哔声的任何属性的引用。

当达到最大时间时,如何在结束时添加不间断的哔声?

0 投票
2 回答
4126 浏览

android - Android上的短信自动回复

首先,一个非编程问题:我的手机会自动回复未接来电并发送一条短信:“对不起。我现在不在我的手机附近。” 我的手机是从哪里得到这个想法的,我该如何让它停下来?

还有一个编程问题:我怎样才能让我的 Android 做任何事情来响应未接来电,例如通过电子邮件将电话号码发送给我,或者只是自定义 SMS 自动回复,也许回复我的位置。

0 投票
4 回答
1256 浏览

usability - 可用性:语音识别与键盘

我们看到越来越多的语音识别被实现,并且需要能够进行良好语音识别的库。与键盘或小键盘相比,它背后的基本原理(在可用性方面)是什么?你有什么理由投资这个开发项目?

例如,让我们以呼叫中心为例。几年前,几乎每个呼叫中​​心都使用提示输入菜单键的 IVR。现在,我们看到越来越多的菜单提示输入关键字和/或按下键盘:“请说出发票或按 1 查看您的发票”。或者我们在公司的电话簿中看到同样的内容:“请说出您要联系的人的姓名”……“弗兰克·洛伊德”……“你说的是杰克·弗洛伊德吗?如果你愿意,请说是联系此人或拒绝重试”。

我想当你在车里而不拿着手机时这是一个加分,但值得额外的等待时间吗?所有选项的交互时间更长,尝试分析是否有人说了什么时的提示时间更长等等?此外,可靠性肯定比以前更好,但有时感觉更像是某人决定插入系统的玩具,因此它可以让人感觉未来感。

有设计 IVR 或使用(或选择不使用)语音识别的软件的经验吗?

谢谢!

0 投票
5 回答
3609 浏览

speech-recognition - “语音触发”检测

我有一个语音应用程序,如果能够使用“触发词”开始录制音频,它将会大大改进。我不需要完整的语音文本引擎,只需要可靠/有效地检测触发词的能力。

我想知道是否有任何专门的语音引擎支持这个特定的用例,或者有任何库/方法来开发这种单一用途的检测引擎。理想情况下,我希望它可以在嘈杂的环境中工作,但可以针对单个用户的声音进行训练。

指向研究论文/主题的指针也将不胜感激,所以我知道要问什么。