问题标签 [pitch-tracking]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python-3.x - 我正在尝试使用 aubio 找到音高,但我无法将 audioData 直接读取为 float32
有没有办法可以将所有值转换为每块数据的 float32?我尝试过这种方式,它不会给我一个错误,但随后奥比奥无法识别任何音高。此外,我不能直接转换为 float32,否则它对于我在程序的不同部分中使用的 FFT 变得过于敏感。
signal-processing - 女声基频
根据我在网上看到的,女声基频的正常范围是165到255赫兹。我正在使用 Praat 和名为 Parselmouth 的 python 库来获取音频文件(.wav)中女性声音的基本频率值。但是,我得到了一些超过 255Hz 的值(例如:400+Hz、500Hz)。获得这样的大值是否正常?
python - 如何打印对象的值?
如何打印对象的值?
而是打印对象的地址。请帮我
python - 可以使用 abio 来检测只有节奏的片段吗?
aubio 是否有办法检测一段音频中缺少音调元素的部分——只有节奏?我测试了一首开始时有 16 秒节奏的音乐,但所有的 aubiopitch 和 aubionotes 算法似乎都能在节奏部分检测到音调。能否以某种方式对其进行调整以区分音调和非音调起始?或者有没有相关的图书馆可以做到这一点?
android - 使用 TarsosDSP 修复 Kotlin 中的“摇晃”音高检测
我正在编写一个乐器调音器应用程序(现在从吉他开始)。对于音高检测,我使用的是 TarsosDSP。它确实可以正确检测音高,但是它很不稳定——例如,我会在我的吉他上敲击(正确调音的)D 弦,它会正确地将其识别为 D,但片刻之后它会循环播放一堆随机笔记很快。我不确定如何最好地解决这个问题。这是我负责检测音高的代码:
然后我编写了一个函数,该函数应该检测与当前音高最近的音符。此外,我还尝试通过编写一个函数来获得“不那么不稳定”的结果,该函数应该以 hz 为单位找到最接近的音高,然后将该结果用于最接近的音符函数,认为这样我可能会得到更少不同的结果(即使它应该是一样的,我也没有注意到任何区别)。下面是两个函数:
有什么想法可以让我获得更一致的结果吗?谢谢!
c++ - 在嵌入式系统上检测两个频率的线性插值
我正在尝试识别嵌入式系统上的一系列音频帧 - 音频帧是可变时间的频率或两个频率的插值。我知道我试图识别的声音(即线性插值的开始和结束频率以及每个音频帧的持续时间),但它们是由另一个嵌入式系统产生的,因此麦克风和扬声器价格便宜且有些不准确。输出是方波。有什么建议如何去做吗?
我现在要做的是使用 FFT 来获取所有频率的幅度,检测峰值,查看检测持续时间/2 ms 前并检查它是否与音频帧有些匹配,最后只是检查是否有任何声音我我正在寻找匹配的序列。
到目前为止,我使用 FFT 来处理麦克风输入 - 在应用 Hann 窗口之后 - 然后根据远离平均值的标准偏差为每个频率区间分配一个峰值系数。这并没有很好地工作,因为它认为房间里安静时会有高峰。关于如何更准确地检测峰值的任何想法?另外我认为由于方波/插值有很多谐波?如果峰值不是真的以两倍频率排列,我可以做谐波乘积频谱吗?
在这里,我用 2226 和 1624 Hz 的插值绘制了噪声(几乎是无声的房间)。 https://i.stack.imgur.com/R5Gs2.png
我以 91 微秒 -> 10989 Hz 采样。我应该更频繁地取样吗?
我在这里添加了在我的笔记本电脑和嵌入式系统上录制时插值声音的示例。 https://easyupload.io/m/5l72b0
javascript - 可定制的 JavaScript 图表构建以实现高性能
我想在浏览器中创建一个软件来监听麦克风并检测它的音高区域。然后我想在实时流线图上显示它。在 yAxis 上将映射 MIDI 键来呈现音符(在引擎盖下 - yAxis 将只是 Hz),在 x 轴上我想显示基于 Hz 的线。
我已经构建了一些可以收听麦克风并实时检测以赫兹为单位的频率的东西。该网站是用 React 编写的。现在我需要使用一些库图表来用音高值更新线条。如果没有这样的值(没有人唱歌/说话),图表将填充空值或缺失值。
是否有任何图表库专注于具有强大的自定义选项的高性能?我尝试了 apache/echarts,但它似乎在实时流式传输方面存在问题。
audiokit - AudioKit 中的 PitchTap 使用什么方法?
有人知道 AudioKit 中实现了什么音高跟踪器吗?我在源代码中找不到任何线索。我们在科学研究中使用它,我们将不胜感激。