问题标签 [voice]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
7 回答
4593 浏览

visual-studio-2008 - Visual Studio 语音命令

你知道钢铁侠在电影中是如何为他的 IDE 使用语音命令的吗?有没有可以做这种事情的 Visual Studio 插件?如果没有,你如何自己制作它们?

0 投票
3 回答
7479 浏览

jquery - 如何使用 jQuery 录制用户语音?

将声音另存为 soundn.wav

0 投票
1 回答
1066 浏览

iphone - iPhone/Objective-C - 转换语音“现场”

所以我正在做一些研究/思考一个我可能会做的项目,并且遇到了一些你们可能能够帮助我回答的问题。

是否可以在 iphone 应用程序(objective-c)中将效果应用到麦克风输入现场。我在 appstore 中看到不少应用程序允许您录制片段,然后对其应用各种转换/声音效果。但是是否可以在没有录音部分的情况下做到这一点 - 所以我可以“说话”并立即改变声音?

将不胜感激任何意见和/或指针!

谢谢!

罗杰

0 投票
4 回答
2991 浏览

.net - .NET 中的语音识别

如何在.NET中实现语音识别?

我有一堆.mp3计算机生成的声音质量相对较高的 s。在每个.mp3声音中,都会说出一些随机文本,然后是一系列 6-7 位英文数字。我想将这些数字提取为文本。

是否可以在.NET 中实现这样的事情?

0 投票
3 回答
2215 浏览

voip - 有人知道类似 Tropo 的服务吗?

我使用过 tropo 并且对服务http://tropo.com/非常满意

有人知道可靠的替代方案吗?

0 投票
2 回答
4863 浏览

java - java : 语音聊天和文字聊天

我想做一个用Java制作的纸牌游戏。人们可以在他们的电脑上运行它。他们可以将他们的朋友添加到他们的联系人列表中,并且当有 4 名玩家在线时,他们可以由其中一名主持游戏的玩家开始游戏。玩家可以通过文字或语音聊天进行交流 可以将其想象成一个聊天客户端,允许用户玩纸牌游戏,并允许 4 个玩家同时进行语音聊天。

我不知道如何进行上述项目。任何人都可以建议我一些框架或其他我可以用来开发上述应用程序的东西吗?它会像 p2p 应用程序一样吗?

0 投票
6 回答
7716 浏览

c - 我有一个 .mp3 文件。如何将人声与 C 中的其他声音区分开来?

在 C 语言中是否有可能[我知道一般来说是可能的 - GOM 播放器可以做到]?让我开始吧……你说什么?

您如何准确识别与其他声音区分开来的人声?

0 投票
2 回答
3802 浏览

c# - c#中的基频+语音检测

我正在尝试通过麦克风的输入实时检测语音。

我已经接收到输入,执行 FFT 算法并得到以 dB 为单位的结果。我有一个频域、一个时域和一个频谱图。

我怎样才能得到基频?如果我得到基频,我可以指定如果频率在某些值之间,那么我们正在说话的是语音吗?有没有其他方法可以用我已经拥有的东西来做到这一点?

提前谢谢

0 投票
1 回答
5961 浏览

algorithm - How do Mel Frequency Cepstrum Coefficients work?

I allready have FFT and pitch + absolute frequency calculated in real-time from input of microphone. Now I want to calculate the timbre.

I saw Mel Frequency Cepstrum Coefficients - MFCCs but I didn't understand it very well. Can someone give me some tips on this..

0 投票
1 回答
2879 浏览

algorithm - Mel频率倒谱系数算法

我想获得一些音频的音色。

为了使用它,我将制作梅尔频率倒谱系数算法。

实现看起来很简单(我已经完成了第 1 步): 1. 对信号(窗口摘录)进行傅里叶变换。2. 使用三角形重叠窗口将上面获得的光谱的功率映射到梅尔标度上。3. 记录每个梅尔频率的功率对数。4. 对 mel 对数幂的列表进行离散余弦变换,就好像它是一个信号一样。5. MFCC 是所得频谱的幅度。

在第 2 步中,我知道如何从频率传递到 mel 比例,但我不知道三角形重叠窗口是什么意思..

如何正确执行此步骤?三角形重叠窗口是什么意思?