问题标签 [voice]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
7 回答
7193 浏览

audio - 分析音高/音符的“哨声”

我正在尝试构建一个系统,该系统将能够处理某人吹口哨和输出笔记的记录。

谁能推荐一个开源平台,我可以将其用作音符/音高识别和波形文件分析的基础?

提前致谢

0 投票
1 回答
496 浏览

iphone - 我正在尝试编写一个独特的应用程序,并使用语音命令来触发应用程序内的特定功能

如果有人能帮我解决这个问题,我将永远欠他们的债。

在没有陷入细节的情况下,我正在尝试对应用程序进行编程,例如,当应用程序当前启动时,如果我说“激活功能 A”,这是我的应用程序中已经存在的特定功能,被激活。

我解释清楚了吗?换句话说,手机屏幕上有一个按钮,上面写着“功能A”。当软件“武装”并处于收听模式时,我希望用户能够简单地说出“激活功能 A”(或我选择的任何其他短语),并且屏幕选项将被选中,而无需用户用手按下按钮,而是通过语音命令选择/激活该选项。

我和我的程序员在整合这种新的语音命令功能时遇到了困难,即使显然可以使用语音命令进行谷歌搜索。目前还有其他语音命令应用程序在流通,例如短信听写应用程序、电子邮件编写应用程序等,因此创建语音命令应用程序显然是可能的。有谁知道这是否可行,如果可以,您对如何实现此功能有建议吗?

问题2

假设我们无法通过语音命令激活功能A,是否可以使用语音命令使电话拨打电话,并且该电话被我们的服务器接收?服务器然后“ping”iPhone 并指示它激活功能 A?要使此解决方法起作用,我需要能够确定确切的短语。换句话说,不能强迫用户使用“调用函数A”这个词。我需要能够选择启动该功能的短语。希望我已经清楚了。

换句话说,作为我们在使用语音命令激活应用程序中的特定功能时所面临的障碍的潜在解决方法,是否可以利用手机中已经存在的语音命令功能?又名,打电话?然后这个呼叫被我们的服务器接收到,服务器相应地ping 发出呼叫的电话,并指示它激活该功能?

在我的应用程序可以接收来自服务器的指令之前,我显然理解当前启动应用程序的必要性。

如果有人能帮我解决这个棘手的问题,说你会改变我的生活一点也不夸张!

非常感谢你们中的一个善良的灵魂可以提供的任何帮助!!!

迈克尔

0 投票
2 回答
542 浏览

modem - 合勤 ADPCM 编解码器

我有一个 ZyXEL USB Omni56K Duo 调制解调器,想在上面发送和接收语音流,但为了达到足够的质量,我可能需要实现一些“ZyXEL ADPCM”编码,因为普通 PCM 提供的采样率太小,无法传输中等质量的语音,而且它也不能通过 USB 工作(可能是因为即使这个比特率对于其中的 USB-Serial 转换器来说也太高了)。

这个神秘的编解码器在所有 Microsoft WAV 相关库中都是理论上支持的众多编解码器之一,但我没有找到任何实现。

有人可以提供任何语言或一些文档的实现吗?编写自定义 mu-law 解码算法对我来说不是问题。

谢谢。

0 投票
2 回答
170 浏览

client - 是否有可以修改的具有群组即时消息和语音功能的基于 Flash 的 Web 客户端?

我正在寻找一个基于 Flash 的 Web 客户端,它具有我可以修改的群组即时消息和语音功能。有谁知道任何开源或专有解决方案?

0 投票
3 回答
704 浏览

cocoa - 如何在可可中实现语音聊天?

我使用 AsyncSocket 类制作了一个简单的聊天应用程序,其中客户端节点可以通过聊天服务器应用程序相互发送消息。我想在其中集成语音聊天功能,但我没有通过网络获得任何可以告诉我正确前进方向的材料。

任何人都可以建议我一些有用的链接或想法,可以帮助我启动它吗?

谢谢,

米拉杰

0 投票
1 回答
131 浏览

cocoa - SSpeechRecognizer 代表被调用的任何单词

我阅读了有关 NSSpeechRecognizer 的信息,发现它可以识别委托中与其关联的一组命令:-speechRecognizer:didRecognizeCommand:我有一个简单的问题:可以为用户说出的任何单词调用此委托吗?我认为..只有有限数量的单词可以与之相关联!

谢谢,

米拉杰

0 投票
2 回答
1041 浏览

cocoa - Cocoa 中基于 Jabber 的服务器和客户端应用程序

我已经实现了一个当前支持文本聊天的应用程序。现在我想在其中实现语音聊天和稍后的视频聊天,但客户提供的时间较少。:( 所以我打算在 Cocoa 中使用一些开源代码,我可以使用这些代码并轻松地将其合并到我的应用程序中。

在网上分析后,我发现一个 Jabber 相关的客户端/聊天服务器应用程序应该是最好的,符合我的要求。

我发现有几个基于 Jabber 的客户端-服务器应用程序,但它们大多是用 Java、C 或 C++ 编写的,并且不是面向 Cocoa 的。

谁能建议我一些基于 Cocoa 的 Jabber 服务器和客户端应用程序的链接或代码?

另外我想问一下,假设我有一个用 C 构建的服务器应用程序和一个用 Cocoa 构建的客户端应用程序,那么我可以在客户端节点之间传输文本和多媒体消息吗?

0 投票
1 回答
1315 浏览

grammar - 在 VoiceXML 中编写语法以匹配 # 个终止的数字或 *1 或 *2

我正在编写一个 VoiceXML 应用程序,但我遇到了问题。应用程序仅侦听 DTMF 音调。

用户输入确认号,后跟#。他们还可以输入 *1 或 *2 与客户服务通话,或重新发送确认消息。

我无法创建一个适用于此的语法。我已经能够使用内置类型digits?minlength=1并且termchar=#对确认码很好。我还能够创建一个基本上复制内置digits功能的语法。

我无法使用 *1 或 *2 功能!它们很特别,因为它们没有终止字符。

有谁知道如何解决这个问题?在这里掉头发....谢谢大家。

0 投票
5 回答
3543 浏览

.net - 我可以使用什么软件或服务以编程方式拨打电话?

我希望根据客户的选择加入请求以编程方式向客户发出电话提醒。我不是电话推销员。

我需要打个电话,并播放一条消息。如果检测到应答机或语音邮件,我需要在哔声后留言。我需要知道消息是否已成功传递。

理想情况下,我可以通过按下按钮并记录他们的选择来提供用户反馈。

我更喜欢 Windows 和 .NET,但会考虑任何事情。

你有什么建议?

0 投票
3 回答
34303 浏览

android - android上的语音识别与录制的声音剪辑?

我在 Android 上使用过语音识别功能,我喜欢它。这是我的客户最受赞誉的功能之一。但是,格式有些限制。您必须调用识别器意图,让它将录音发送到谷歌,然后等待文本返回。

我的一些想法需要在我的应用程序中录制音频,然后将剪辑发送到谷歌进行转录。

有什么方法可以发送音频剪辑以将语音处理为文本?