“voice”的相关标签问题_Stack Overflow中文网

0 投票

15 回答

3367 浏览

voip - 您的交互式语音响应平台是什么？

对于那些在语音领域工作的人，您使用什么作为 IVR 平台？我正在使用 Microsoft Speech Server 2007。有哪些等效软件包？是否有人使用开源软件来处理呼入或呼出电话？请注意，我不只是在谈论语音识别，它是一个综合包的一个组成部分。IVR 平台将包括语音识别、文本到语音、VUI 技术（如 VoiceXML）以及通过 SIP 或电话硬件的呼叫终止。

Eric Z Beard

2008-08-14T02:01:02.253

0 投票

16 回答

20676 浏览

speech-recognition - 面向开发人员的语音识别软件

好吧，医生终于说出来了，我需要在手腕上放松几个月。由于我是一名 .NET 开发人员，这可能会暂时结束我的生计，我并不急于这样做。也就是说，开发人员有什么好的免提选项吗？有人成功使用了任何语音识别软件吗？

后记：我的手臂再次恢复到双手编程不成问题的程度。Dragon 自然地运行良好，但速度较慢，不像键盘那样我编程的速度比我想象的要快。

speech-recognition voice ergonomics speech code-by-voice

2008-09-17T21:45:09.330

0 投票

2 回答

5918 浏览

python - 如何从输入音频流中提取频率信息（使用 PortAudio）？

我想使用PortAudio（PyAudio）录制声音（语音）并在屏幕上输出相应的声波。像我一样绝望，我无法从音频流中提取频率信息，以便我可以以赫兹/时间的形式绘制它。

这是一个示例代码片段，它记录和播放录制的音频五秒钟，以防它有帮助：

我希望从上述变量“数据”中提取所需的信息。（或者使用 PortAudio 或其他带有 Python 绑定的库的其他高级方法。）

我将非常感谢任何帮助！即使是模糊相关的音频分析智慧的花絮也受到赞赏。:)

python voice frequency portaudio

user12163

2008-11-03T18:07:45.473

0 投票

3 回答

14966 浏览

browser - 如何在浏览器中录制语音？

我需要用户在浏览器上录制他们的声音，然后自动将生成的 mp3 上传到网络服务器。

我在想用户按下一个大胖开始记录/停止记录按钮来做到这一点。

然后，这会将文件保存在用户硬盘上。然后它将被有效地压缩并自动 ftp'd 到一个网站。

是否可以使用 ActiveX 或 Java 来做到这一点？或者有没有图书馆可以提供帮助？

该应用程序适用于可以在需要时安装软件的用户，因此可以安装 exe 或其他任何东西。

任何建议都非常感谢。

browser record voice

Petras

2009-02-16T23:14:27.913

0 投票

2 回答

3190 浏览

python - Python 中的视频和语音聊天可操作性

我正在尝试在 Python 中查找有关视频和语音聊天可操作性的资源......有人知道一些好的资源或示例项目吗？

任何帮助将不胜感激！

python audio chat voice

Chris

2009-02-26T10:56:32.550

0 投票

1 回答

476 浏览

voice - VXML从变量中获取子对话框的'src'

我们的业务正在从旧的 ASP 系统过渡到更新的 ASP.NET 系统，包括对我们的数据库进行大量改进。将会有一段共存的时期，在此期间，新旧将并存。

一个需要共存的应用程序是我们使用的语音邮件系统。它的工作原理如下：

用户来电。
用户输入帐号。
用户记录该帐户的消息。
用户可以选择重新录制、接受或丢弃。

在共存期间，正在修改现有应用程序。当用户输入已转换为新系统（使用不同的识别号码）的帐号时，我们希望无缝地允许他们继续。帐户验证系统当前正在返回帐户名称、帐号和（用于共存）到正确记录页面的路径。

一旦用户记录了一条消息并接受它（或挂断），我们就会触发一个子对话框来将消息记录到我们的数据库中。

如何修改子对话框调用以接受变量的内容作为 src？

voice vxml coexistence

Jeff

2009-03-12T20:04:44.740

0 投票

1 回答

410 浏览

voice - VXML 在录制超时时发出哔声

我在上一个问题中提到的 VXML 应用程序现在正在测试中。在允许用户录制消息（最长 5 分钟）后，我们进入标准菜单（提交、播放、重新录制等）。

我们的一个测试人员，厌倦了任何事情并且厌倦了留下 5 分钟的消息，正在阅读我们发送的电子邮件，其中包括电话号码。菜单刚开始，她就说“两个”，只听到了菜单的一瞬间。

不用说，她很困惑。

对我来说，解决这个问题的正确方法似乎是在录音中添加一个明确的停止，就像开始它的哔哔声一样。

记录项有一个 beep 属性，它在记录开始时发出哔声，我们使用它。我找不到对用户达到最大时间时会发出哔哔声的任何属性的引用。

当达到最大时间时，如何在结束时添加不间断的哔声？

voice vxml voicemail

Jeff

2009-03-19T19:47:32.567

0 投票

2 回答

4126 浏览

android - Android上的短信自动回复

首先，一个非编程问题：我的手机会自动回复未接来电并发送一条短信：“对不起。我现在不在我的手机附近。” 我的手机是从哪里得到这个想法的，我该如何让它停下来？

还有一个编程问题：我怎样才能让我的 Android 做任何事情来响应未接来电，例如通过电子邮件将电话号码发送给我，或者只是自定义 SMS 自动回复，也许回复我的位置。

android sms voice auto-responder

2009-04-07T18:29:11.687

0 投票

4 回答

1256 浏览

usability - 可用性：语音识别与键盘

我们看到越来越多的语音识别被实现，并且需要能够进行良好语音识别的库。与键盘或小键盘相比，它背后的基本原理（在可用性方面）是什么？你有什么理由投资这个开发项目？

例如，让我们以呼叫中心为例。几年前，几乎每个呼叫中心都使用提示输入菜单键的 IVR。现在，我们看到越来越多的菜单提示输入关键字和/或按下键盘：“请说出发票或按 1 查看您的发票”。或者我们在公司的电话簿中看到同样的内容：“请说出您要联系的人的姓名”……“弗兰克·洛伊德”……“你说的是杰克·弗洛伊德吗？如果你愿意，请说是联系此人或拒绝重试”。

我想当你在车里而不拿着手机时这是一个加分，但值得额外的等待时间吗？所有选项的交互时间更长，尝试分析是否有人说了什么时的提示时间更长等等？此外，可靠性肯定比以前更好，但有时感觉更像是某人决定插入系统的玩具，因此它可以让人感觉未来感。

有设计 IVR 或使用（或选择不使用）语音识别的软件的经验吗？

谢谢！

usability speech-recognition voice ivr

2009-05-22T15:13:32.703

0 投票

5 回答

3609 浏览

speech-recognition - “语音触发”检测

我有一个语音应用程序，如果能够使用“触发词”开始录制音频，它将会大大改进。我不需要完整的语音文本引擎，只需要可靠/有效地检测触发词的能力。

我想知道是否有任何专门的语音引擎支持这个特定的用例，或者有任何库/方法来开发这种单一用途的检测引擎。理想情况下，我希望它可以在嘈杂的环境中工作，但可以针对单个用户的声音进行训练。

指向研究论文/主题的指针也将不胜感激，所以我知道要问什么。

speech-recognition signal-processing voice voice-recording

2009-05-23T17:03:20.017

问题标签 [voice]

Reference