问题标签 [waveform]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
matlab - 精确对齐两个 wav 文件
我有一个工具,它逐帧比较两个音频 wav 文件并返回一个等级,该等级给出了两个文件之间的相似度。
我有一个原始的 wav 文件和一个 wav 文件的录音,因为这两个文件几乎相似,所以我应该得到很高的相似度,但我得到的分数很差,主要是由于录制的文件前导有非常轻微的延迟帧不匹配
我的问题是 - 我如何使用 MATLAB 准确对齐两个音频文件,以便可以进行有效的帧到帧比较。
verilog - 如何查看内存波形?
我无法memory
使用 gtkwave 查看:
你有什么建议来查看波形memory
?
或者如何在 gtkwave 或任何 .vcd/波形查看器中显示二维数组?
r - 给定指定的分贝级别,如何在 R 中创建波浪声音?
IR,感谢库sound
,我们能够创建正弦波:
绘制波形我们得到这样的图像:
波形在区间 [-1, +1] 内移动。如果我播放它,它对应于多少分贝?
如何生成具有指定分贝级别的波声(具有相同的参数)(即波声,频率650Hz,持续时间1秒,采样率44100,16位,2通道,55dB)?
提前致谢!
c++ - 来自麦克风的声音与来自扬声器的声音
我想分别从麦克风和扬声器捕获音频。我怎样才能区分它们?我可以使用 Wave API(例如 WaveInOpen())捕获其中一个或另一个。
当我使用waveInGetNumDevs() 和waveInGetDevCaps()/waveoutGetDevCaps() 枚举设备时,似乎没有与特定端点设备(例如,麦克风或扬声器)相关的信息。我只看到以下,它们是适配器设备:
高清读取音频输入
高清读取音频输出
网络摄像头...
java - 如何在 Java 中分析 .wav 文件的音量、音高和速度?
所以,我正在尝试重新制作 Vib 功能区:http ://www.youtube.com/watch?v=ehdymXc0epY 输入将是一个 .wav 文件,我对如何分析和创建它一无所知音量和音高的阈值会产生不同的障碍 - 我被指出傅里叶变换,我不明白。有人可以向我指出适用于这种情况的波形分析课程并让我知道如何开始吗?我一直无法获得诸如 AudioSurf 和音乐可视化器之类的源代码。
为什么是java,你可能会问?我正在学习 Java 入门课程,因此没有其他语言可以使用。
speech-recognition - 编写软件来判断声音的来源(定向聆听)
我对此感到好奇已经有一段时间了,所以我想也许在这里发帖我可以得到一些好的答案。
到目前为止我所知道的:
人类不仅可以用两只耳朵听到“听起来像”的声音,还可以知道它们来自哪里。音高是我们听到的音符,像人声这样的东西有不同的音高叠加(不是纯音。)
我想知道的:
我该如何编写一个可以知道声音来自哪里的程序?从理论上讲,我需要两个麦克风,然后我会记录来自麦克风的声音数据并存储音频数据,以便可以将一瞬间的音频数据放入像 [streamA,streamB] 这样的元组中。
我觉得可能有一种公式/数学方法可以根据声音来自的音频进行计算。我也觉得可以获取流数据并训练学习者(给它样本音频并告诉它音频来自哪里)并让它以这种方式对传入的音频进行分类。
执行此操作的最佳方法是什么/是否有好的资源可以让我了解有关该主题的更多信息?
编辑:
例子:
左(麦克风)x ======== x(麦克风)右
我想编写一个程序,可以为它听到的大部分声音返回前/后左/右。据我了解,设置两个指向“向前”的麦克风应该很简单。基于此,我试图找出一种方法,我们可以对声音进行三角测量,并了解音源相对于麦克风的位置。
python - 在 SciPy.IO.wavfile 中,我遇到了数据的 ndim 问题
我有一个一维数组 y,有 132300 个条目。
给我1。
现在,当我使用 write('440saw2000.wav', '44100', 'y') 时,我收到以下错误消息:
我该如何解决这个问题?
谢谢。
audio - 将表转换为原始二进制/十六进制文件
因此,我设法从这种形式的模拟器中获得了文本输出:
...并且需要将所有整数转换为 .wav 格式的两字节二进制字,因此每个数字代表一个样本。Little Endian 模式是必需的。
我试图用 Notepad++ 做到这一点,但失败了。NL 字符的存在可能会使某些内置插件感到困惑,但在它们具有正确长度之前不能合并数字。
我会非常感谢任何可以轻松做到这一点的技巧。提前致谢。
php - 在php中绘制声波
我在 php 中开发了一个脚本来绘制 wav 文件的声波。尽管效果很好,但听起来很长,大约需要 20 分钟,需要 2-3 分钟来绘制图像。我正在使用一组样本的峰值来表示某个像素中的波。我也得到长值,即同时获得 4 个字节来获得左、右、负值和正值。还有一项改进是我在同一迭代中取 4 个长值。
wav 是 a-law 立体声 16 位,但我使用解码算法来获取 pcm 值,因此 16 位变为 8 位。
8000Hz,每个样本 8 位,64 Kbps,立体声,A 律
我需要生成 1500 像素宽的图像。
一些算法或网页如何提高脚本的性能也会有所帮助。
Audacity 在大约 2-3 秒内生成相同声音的图像 :)
谢谢。如果需要,我会发布一些代码。
这是读取声音数据块的for循环
32 bit = 4 * 8 bit,每一位都是左右声道。因此,对于上述循环的一行,我为左声道取 2 个值,为右声道取两个值。但是对于 20 MB 文件,我得到 $this->blocktotal= 20147456 ,因此上述循环将重复大约 500 万次。有什么改进的想法吗?我试图同时读取 8 个 Long 值,但给出的图像与预期不同,我不知道为什么。
r - R 等效于 MATLAB 的 filter 函数
我正在使 MATLAB 代码适应 R 并尝试使用 ARMA 公式生成波形。MATLAB 是否有一个简单的 R 等效函数filter
来获取 AR/MA 系数来构建波形?