问题标签 [voice]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
voip - 您的交互式语音响应平台是什么?
对于那些在语音领域工作的人,您使用什么作为 IVR 平台?我正在使用 Microsoft Speech Server 2007。有哪些等效软件包?是否有人使用开源软件来处理呼入或呼出电话?请注意,我不只是在谈论语音识别,它是一个综合包的一个组成部分。IVR 平台将包括语音识别、文本到语音、VUI 技术(如 VoiceXML)以及通过 SIP 或电话硬件的呼叫终止。
speech-recognition - 面向开发人员的语音识别软件
好吧,医生终于说出来了,我需要在手腕上放松几个月。由于我是一名 .NET 开发人员,这可能会暂时结束我的生计,我并不急于这样做。也就是说,开发人员有什么好的免提选项吗?有人成功使用了任何语音识别软件吗?
后记:我的手臂再次恢复到双手编程不成问题的程度。Dragon 自然地运行良好,但速度较慢,不像键盘那样我编程的速度比我想象的要快。
python - 如何从输入音频流中提取频率信息(使用 PortAudio)?
我想使用PortAudio(PyAudio)录制声音(语音)并在屏幕上输出相应的声波。像我一样绝望,我无法从音频流中提取频率信息,以便我可以以赫兹/时间的形式绘制它。
这是一个示例代码片段,它记录和播放录制的音频五秒钟,以防它有帮助:
我希望从上述变量“数据”中提取所需的信息。(或者使用 PortAudio 或其他带有 Python 绑定的库的其他高级方法。)
我将非常感谢任何帮助!即使是模糊相关的音频分析智慧的花絮也受到赞赏。:)
browser - 如何在浏览器中录制语音?
我需要用户在浏览器上录制他们的声音,然后自动将生成的 mp3 上传到网络服务器。
我在想用户按下一个大胖开始记录/停止记录按钮来做到这一点。
然后,这会将文件保存在用户硬盘上。然后它将被有效地压缩并自动 ftp'd 到一个网站。
是否可以使用 ActiveX 或 Java 来做到这一点?或者有没有图书馆可以提供帮助?
该应用程序适用于可以在需要时安装软件的用户,因此可以安装 exe 或其他任何东西。
任何建议都非常感谢。
python - Python 中的视频和语音聊天可操作性
我正在尝试在 Python 中查找有关视频和语音聊天可操作性的资源......有人知道一些好的资源或示例项目吗?
任何帮助将不胜感激!
voice - VXML从变量中获取子对话框的'src'
我们的业务正在从旧的 ASP 系统过渡到更新的 ASP.NET 系统,包括对我们的数据库进行大量改进。将会有一段共存的时期,在此期间,新旧将并存。
一个需要共存的应用程序是我们使用的语音邮件系统。它的工作原理如下:
- 用户来电。
- 用户输入帐号。
- 用户记录该帐户的消息。
- 用户可以选择重新录制、接受或丢弃。
在共存期间,正在修改现有应用程序。当用户输入已转换为新系统(使用不同的识别号码)的帐号时,我们希望无缝地允许他们继续。帐户验证系统当前正在返回帐户名称、帐号和(用于共存)到正确记录页面的路径。
一旦用户记录了一条消息并接受它(或挂断),我们就会触发一个子对话框来将消息记录到我们的数据库中。
如何修改子对话框调用以接受变量的内容作为 src?
android - Android上的短信自动回复
首先,一个非编程问题:我的手机会自动回复未接来电并发送一条短信:“对不起。我现在不在我的手机附近。” 我的手机是从哪里得到这个想法的,我该如何让它停下来?
还有一个编程问题:我怎样才能让我的 Android 做任何事情来响应未接来电,例如通过电子邮件将电话号码发送给我,或者只是自定义 SMS 自动回复,也许回复我的位置。
usability - 可用性:语音识别与键盘
我们看到越来越多的语音识别被实现,并且需要能够进行良好语音识别的库。与键盘或小键盘相比,它背后的基本原理(在可用性方面)是什么?你有什么理由投资这个开发项目?
例如,让我们以呼叫中心为例。几年前,几乎每个呼叫中心都使用提示输入菜单键的 IVR。现在,我们看到越来越多的菜单提示输入关键字和/或按下键盘:“请说出发票或按 1 查看您的发票”。或者我们在公司的电话簿中看到同样的内容:“请说出您要联系的人的姓名”……“弗兰克·洛伊德”……“你说的是杰克·弗洛伊德吗?如果你愿意,请说是联系此人或拒绝重试”。
我想当你在车里而不拿着手机时这是一个加分,但值得额外的等待时间吗?所有选项的交互时间更长,尝试分析是否有人说了什么时的提示时间更长等等?此外,可靠性肯定比以前更好,但有时感觉更像是某人决定插入系统的玩具,因此它可以让人感觉未来感。
有设计 IVR 或使用(或选择不使用)语音识别的软件的经验吗?
谢谢!
speech-recognition - “语音触发”检测
我有一个语音应用程序,如果能够使用“触发词”开始录制音频,它将会大大改进。我不需要完整的语音文本引擎,只需要可靠/有效地检测触发词的能力。
我想知道是否有任何专门的语音引擎支持这个特定的用例,或者有任何库/方法来开发这种单一用途的检测引擎。理想情况下,我希望它可以在嘈杂的环境中工作,但可以针对单个用户的声音进行训练。
指向研究论文/主题的指针也将不胜感激,所以我知道要问什么。