问题标签 [sound-recognition]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
232 浏览

android - 如何计算android中声音的最大振幅?

我在这里寻找一种计算最大幅度出拳声音的功能。我在我的演示应用程序中使用了 android 语音识别 API,但它正在计算所有声音(噪音),并且计数运行得像子弹速度一样。我只想计算影响沙袋声音的拳击并且不想错过任何拳击,这个计数不会改变音乐、说话和打喷嚏的声音。

0 投票
1 回答
4438 浏览

java - 摩尔斯电码音频解码器 (Android)

我需要为 Android 创建一个“莫尔斯电码解码器”,非常类似于这个应用程序:https ://play.google.com/store/apps/details?id=org.jfedor.morsecode

我的应用程序必须从麦克风收听声音(摩尔斯电码)。并将代码翻译成原文。

老实说,这个功能是一个更大项目的一部分。我的意图是创建一个系统:

  • ENCODE:一个将文本翻译成声音的Java应用程序(在这种情况下,我选择了莫尔斯电码......我们没有太多时间来创建我们的“字母表”......)。所以,它是文本到声音的。
  • DECODE:一个Android App,用于“听”这个声音(莫尔斯电码)并获取原文。所以,声音到文本。

创建 java 应用程序没有问题,但它适用于 android 应用程序......听声音是可以的,但要理解它是问题所在。

只需将问题分解为多个部分。有:

1)从麦克风录音[好的,没问题]

2)检测音调的开始时间

3)将其构建成一系列点和破折号。

4)将其翻译成文本

我将从第 2 步开始)... 想像这样行事:我将应用程序设置为以特定频率和速度收听声音。必须识别莫尔斯电码...翻译它并为用户打印原始文本...但是如何?我不知道从哪里开始。有任何想法吗?

0 投票
1 回答
1156 浏览

python - 如何获取特定频率范围的值

我有一个 .wav 文件,我加载它并得到下一个频谱图,以 dB 为单位显示频谱

http://i.stack.imgur.com/22TjY.png

现在我想确切地知道这些值,因为我想与其他 wav 文件进行比较,以识别这 4 个值是否存在。

http://i.stack.imgur.com/Jun25.png

生成该图片的来源(取自其他 stackoverflow 示例)

我“认为”信息在 Pxx 中,但我不知道如何获取它。

0 投票
0 回答
150 浏览

pointers - 参数列表错误 C++/CLR

我正在创建一个声音识别程序,但有一个我无法在 C++ 中解决的语法错误,它是:

错误说:

错误 1 ​​错误 C3867:“SoundRecognizer::MyForm::sRecognize_SpeechRecognized”:函数调用缺少参数列表;使用 '&SoundRecognizer::MyForm::sRecognize_SpeechRecognized' 创建指向成员 d:\c++\stu​​dio\testing\soundrecognizer\soundrecognizer\MyForm.h 的指针 114 1 SoundRecognizer

功能sRecognize_SpeechRecognized

0 投票
2 回答
2162 浏览

ios - Swift 中的“声音”识别?

我正在使用 Swift 开发一个应用程序,并且正在考虑一种在我的项目中获得非语音声音识别的方法。

我的意思是有没有一种方法可以让我接受声音输入并将它们与项目中已经包含的一些预定义声音进行匹配,如果发生匹配,它应该执行一些特定的操作?

有没有办法做到以上几点?我正在考虑分解声音并进行检查,但似乎没有比这更进一步的了。

0 投票
1 回答
308 浏览

speech-recognition - 使用哪个麦克风进行声音识别是否重要?

如果是,那么音频识别应用程序如何在不同设备中工作?

例如,谷歌翻译适用于 iphone-6、samsung-s6、htc-m9 ...

0 投票
1 回答
995 浏览

machine-learning - 在声音识别中进行异常值检测的方法?

有模型可以识别 2 类声音,即 A 类和 B 类。

如何将C类声音识别为异常声音?

我尝试在按帧识别时设置阈值。

例如,

如果一个声音有 10 帧,结果是

表现非常糟糕。

我应该怎么办 ?

0 投票
0 回答
149 浏览

javascript - Web Speech API - 原始词

我试图让网络语音 api 给我正在说出的原始字母。从 api 我发现了这个:

SpeechRecognitionAlternative:成绩单属性 成绩单字符串表示用户说出的原始单词。对于连续识别,必须在必要时包含前导或尾随空格,以便连续 SpeechRecognitionResults 的连接产生会话的正确转录。

虽然我不确定如何使用它。

我需要的是检测用户是否正在发出特定的声音。与医生检查喉咙时发出的声音相同 - 说“AHHHHHHHHH”

网络语音识别的问题在于,它并没有把那个声音看作是一个有效的词,因为它实际上不是。所以我需要在用户发出声音时以某种方式获取原始字母。

这可能吗?

谢谢

0 投票
1 回答
324 浏览

python - C 或 Python 中的声音识别和分类库

...

大家好!

我是一名学生,试图制作一个关于声音识别的“自己动手”设备。不像语音识别那么精确和复杂,我只是想为我的小应用程序采用和使用一些简单的识别库。

换句话说,我想要做的是“大范围”的声音识别。即,如果有声音“轰!轰!” 然后我真的不必识别诸如“好吧,那是雪佛兰克尔维特 Z06 的某种发动机声音。不错的机器,嗯?” (X) 而是将其识别为类似“汽车。向我驶来。响亮而嘈杂。” (O)这就够了。

或者,如果有声音“Ka-boom!” “嘭!”,我不用认出来,“北桥放烟花,这个冬天?说不定外面有智障。” (X) 但是,“火爆。我永远不会去那里。奇怪。” (O)这就够了。... 等等。也就是说,我想用匿名库对声音进行“分类”,并将其用作我的应用程序给出的指南的有用信息。

有什么有用的信息,或者我可以参考的推荐库吗?我会等待你的好建议。谢谢你。

问候,

J.公园

0 投票
2 回答
4080 浏览

android - 波斯语语音到android中的文本

我想提高我的知识并进行合理的重组(从语音到文本)。我从谷歌找到了很好的样本,但我不知道如何使用波斯语-波斯语来做到这一点?我用英语做,但波斯语怎么样?我的安卓手机需要一些设置吗?有人这样做吗?