问题标签 [sound-recognition]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
180 浏览

c# - 在 MS Visual C# 中听写?

我想做一个文本编辑器,但它与其他文本编辑器不同。它会从我的声音中获取命令。

例如 ; 我会对麦克风“Ibrahim AKGUN”说我的名字..然后这个程序会得到它并像虚拟秘书一样写下来:)

这在 C# 中是可能的吗?

0 投票
5 回答
11527 浏览

c# - C# 中的拍手声音检测

我希望能够检测到拍手声。对任何形式的声音识别都很陌生,有没有简单的方法可以做到这一点?如果没有,C# 声音识别/检测的任何好的资源?

我的目标是使用一些基本的基于拍手的控件来自动化客户媒体中心。

0 投票
1 回答
428 浏览

android - 用于服务器端估计/识别音频文件相似性的框架/算法/库?

我想实现一个 android 应用程序,它将录制的音频文件与我们的声音数据库进行比较并报告一个相似度指标。该应用程序将以某种方式像 Shazam 一样工作,但与我们的数据库音频文件相匹配。谁能指出一个开源项目,它实现了足够的算法来在我们的服务器上进行声音识别/比较?谢谢

0 投票
2 回答
666 浏览

delphi - 如何在delphi中比较.wav样本?

我想.wav通过比较两个文件来开始研究样本。比如以百分比返回持续时间、口音、发音的结果。等或任何比较/分析.wav.

0 投票
2 回答
3590 浏览

audio - 软件:软件如何识别歌曲?

我正在玩我的手机,上面有一个应用程序,当你用它录制一首歌的 10 秒时,它会告诉你这首歌的标题和作者。现在作为一名软件工程师,我不禁想知道,这是如何工作的?

0 投票
1 回答
710 浏览

iphone - iPhone应用声音识别?

我正在尝试让应用程序记录麦克风输入并响应某些声音。这些声音将被预先录制并在不同的设备上播放——比如网站或电视。

所以我猜这将是一个比较音频数据的问题。关于一个开始的好地方有什么想法吗?

0 投票
1 回答
1471 浏览

c# - 使用 c# 进行音乐(流派)识别

我需要在 C# 中为学校目的做一个音乐识别应用程序(识别一些音乐流派 - 风格)

你能推荐一些好的方法(资源、API、库、文章)来做到这一点吗?

非常感谢。

0 投票
0 回答
192 浏览

audio - 嗡嗡声查询

我不知道这是否是问这个问题的最佳地点。我正在为我的学士学位开发一个课程项目,它基本上是一项通过让用户哼唱作为输入来搜索歌曲的服务。

你们中的任何人都可以提出一种有效且或多或少易于实施的最佳方法。你能推荐一些文章来阅读吗?我有大约两个月的时间来完成这个项目。我已经做了一些初步的研究,我的选择是使用 MIDI 文件的方法。现在我正在尝试改用另一种方法,因为我找不到一个好的软件来创建 MIDI(转换是非常复杂的过程,我不知道我是否有足够的时间来投资这种解决方案)。

基于频域分析的方法的效率和精确度如何?

0 投票
1 回答
864 浏览

.net - .NET sdk 用于从 mp3 文件中获取歌曲信息(识别)

是否有使用 MP3 文件作为输入来获取音乐信息(艺术家、专辑、年份等)的 SDK/Web 服务?类似于 android 的 Soundhound,但作为用于 .NET 的 API

编辑:也许,我不是很清楚。输入:没有任何 ID3 信息的 MP3 文件。输出:歌曲信息(通过使用网络服务/数据库识别获得,如 Soundhound 或 Shazam)

更加具体。当您右键单击播放列表中的歌曲->查看文件信息->自动标记时,我需要WinAmp所做的事情

0 投票
1 回答
185 浏览

.net - 如何分析语音并存储结果?

我正在考虑创建一个应用程序。

以下是描述: 1. 人们将之前录制的对话上传到服务器。2. 来自服务器的应用程序将检测该声音的音高、速度、重点、发音等,并创建个人组合。3. 如果您呼叫服务器,则服务器应用程序将以该人(其语音服务器在步骤 2 中检测到的语音服务器)的确切语音与您交谈。

请分享链接、资源、pdf 演示文稿,无论您觉得对这个项目有用......

主要是我被困在第 2 步。我不清楚如何分解声音并分析它并获取速度、音高等信息。是否有任何现有的 API 可用于语音部分?