问题标签 [signal-processing]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
linux - 如何在 Octave 中播放声音?
Octave 似乎假设系统上可以使用特定的声音播放实用程序,但似乎不提供指定替代的能力。在下面的错误中,Octave 正在寻找ofsndplay
不是所有系统上都可用的实用程序。
八度:38> 声音(beamformed_20)
sh: ofsndplay: 找不到命令
是否有 Octave 配置设置或代码片段可用于指定适合系统的实用程序?
math - 如何在 Matlab 中生成较低频率的信号版本?
使用正弦输入,我试图修改它的频率,削减频谱中的一些较低频率,将主频率移向零。由于信号没有 fftshift,我试图通过在 fft 向量的开头和结尾消除一些样本来做到这一点:
但它没有按预期工作。我还尝试去除频谱的中心部分,但它也使用了更高频率的正弦波。
如何使它正确?
audio - 智能手机上音符的音高识别,pt。2
作为我之前问题的后续,如果我希望我的智能手机应用程序检测到某个音符,并且我只需要知道传入的声音是否是那个音符,并带有一定的模糊性,就可以允许注意要偏离 x 美分。
鉴于此,在速度和准确性方面是否有比其他方法更好的方法?也就是说,通过知道您要查找的音符是#C3,如何最好地判断该音符是否存在?我假设寻找单个音符比分离所有波形更容易,然后查看基频的结果。
在对我最初问题的回答中,一位受访者建议,如果您知道注释在一定范围内,自相关可能会很好地发挥作用。我想知道如果您只需要检查是否存在某个音符(+/- x 美分),那么自相关是否会更好。
这些方法是:
- 亲吻 FFT
- FFTW
- 离散小波变换
- 自相关
- 过零分析
- 倍频程滤波器
- 载重吨
任何想法将不胜感激。
c++ - 音频处理 - 音调识别
我已经开始开发一个简单的吉他调音器作为音频处理程序的学习项目。
有人可以为我推荐一个足够的图书馆吗?这基本上就是我要找的东西:
- 麦克风输入。
- 信号的实时处理。我需要能够对麦克风播放的任何内容进行音符识别。
- 跨平台/开源将是一个巨大的优势。
javascript - 是否可以使用 Javascript 在音频文件中找到一段无声的片段?
我一直在研究一种用 Javascript 转录语音录音的工具。基本上,我正在连接关键事件以播放、暂停和循环使用audio
标签读取的文件。
有许多先进的现有桌面应用程序可用于执行此类操作(例如Transcriber - 这是一个屏幕截图)。大多数转录工具都有一个内置的波形,可用于在音频文件中跳转,这非常有帮助,因为转录者可以学习视觉查找和重复或循环短语。
我想知道是否可以使用 Javascript 在浏览器中模拟此功能的子集。我对信号处理了解不多,也许它甚至不可行。
但我设想的是 Javascript 从文件中读取声音流,并定期对幅度进行采样。如果幅度非常低的时间超过某个阈值时间,那么这将被标记为短语中断。
我认为,这种标记对于转录非常有用。然后我可以设置关键命令来跳转到之前的静音期。所以假设(想象一个基于 jQuery 的 API):
silences
然后将包含一个时间列表,所以我可以连接一些方法让用户在各种silence
s 中跳转,然后将 设置currentTime
为一个选定的值,然后播放它。
甚至可以想象用 Javascript 做这种事情吗?
c++ - 谁能推荐一个不错的 C++ DSP/语音库?
尽管SPUC引起了我的注意,但 Google 返回的结果太多。是否有像 OpenCV 这样的标准推荐库用于视觉?必要的功能是:
- 免费开源
- 滤波器设计(Butterworth、Chebyshev 等)
- 快速傅里叶变换
- 如果可能的话,一些语音处理功能,比如 MFCC 计算,虽然那是次要的,因为我可以使用 SPTK (sp-tk.sourceforge.net) 作为那部分。
visualization - 以编程方式“聆听”声音(信号处理?)
我熟悉计算机视觉(嗯,知道它),其中一个应用程序可以是图像识别,例如光学字符识别,我相信。但是,我更感兴趣的是“计算机聆听”,我刚刚学过的被认为是数字信号处理。
信号处理最让我感兴趣的是在音乐中的潜在应用。我记得不久前我看到了一个应用程序的预览(对不起,忘记了名字),它可以收听某人弹吉他的录音,并在时间线上自动将其与实际演奏的音符/和弦绘制成图表. 使用该程序,用户可以移动它们甚至编辑它们。现在,显然这要复杂得多,但它涉及同样的事情吗?信号处理?我还对音乐可视化器和智能照明系统中的可能应用感兴趣。
我的理解是,对 MP3 等压缩音频格式进行此处理不会产生与包含单独音轨的 MIDI 相同的结果(也许我误解了)。PCM 等未压缩格式会比 MP3 做得更好吗?我对声音处理一无所知,这正是我从目前所读到的内容中推断出来的。
我已经看过这个问题,它有很好的答案和链接,涵盖了我的很多问题。但是,我发现的大多数链接都是理论性的,我敢肯定它们都很有趣,并且鉴于我对该主题的兴趣,绝对值得一读,但我想知道是否有任何现有的库可以促进这一点,或与该主题相关的面向计算机科学/编程的文章,可能带有示例代码。即使是开源声音/音乐可视化器或任何其他开源声音处理代码也会很棒。
对不起,如果我没有任何意义。就像我说的,我不知道我在说什么。
c++ - C++ 声音处理
我正在寻找一个可用于操作音频文件的库。基本上我想做的是:
加载 MP3/WAV 文件
获取文件的 15 秒剪辑
在其上覆盖另一个 MP3/WAV 文件
渲染为新的 MP3/WAV 文件