问题标签 [soundfile]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 将 .wav 读取为字节
我正在使用 2 个工具在 Python 中读取 .wav 文件。首先 - 带模块soundfile
:
结果我得到了这样的字节数据。这是正确的:
然后我用模块阅读 .wav wave
:
结果字节完全不正确:
为什么两个不同的工具没有给出相同的结果?如何从第一个字节对象制作第二个字节对象?事实上,我不能使用wave
's 字节,因为它与原始音轨完全不同。
python - Python 的 SoundFile:soundfile.write 和剪辑
假设我使用 Python 读取 WAV 文件soundfile
,
数组x
在float32
和中max(x) = 1, min(x) = -1
。也就是说:每个样本x
都是 -1 和 1 之间的 float32 数字。我对其进行一些操作并得到y
. 现在我想保存y
到 WAV 文件。假设y
现在的值大于 1(和/或小于 -1),我使用
SoundFile 如何处理超出的值?它是否进行削波(如果y[t] > 1
需要y[t] = 1
)或归一化(将整个信号除以max(abs(y))
)或其他什么?
我没有在文档中找到答案:https ://pysoundfile.readthedocs.io/en/latest/#soundfile.write
输出是:
因此,它似乎确实会进行剪辑,但我想确定一下。我可以控制如何soundfile.write
处理超值吗?
python - 在音频文件上对我的机器学习模型进行单元测试时出错
我在训练我的机器学习模型时遇到错误,该模型用于检查一个人在说某事时的感受。我正在使用来自 sklearn 的 librosa、soundfile 和 MLPClassifier。这是我的代码:
这是我得到的错误,当我尝试通过其他方法(如使用 pydub )删除它时,我得到不同类型的错误。我是这方面的初学者,仍然需要学习很多东西。所以我希望能找到解决这个问题的方法。
python - 重新采样音频文件不会产生预期的结果
我想将 32000 KHz 的录音重新采样到 16000 KHz。我已经用下面的代码做到了这一点。但是输出音频有些混乱。
您可以在以下文件夹中找到原始音频以及输出 https://drive.google.com/drive/folders/1vr-ib8zvZagH_QeE4JSUtAUpp3EG75va
任何想法我做错了什么?
python - python soundfile.read() 返回(通道 x 帧)数组
只是我,还是立体声文件的 soundfile.read() 尺寸改变了,或者 librosa.to_mono() ?
我的代码不再工作 - to_mono 抱怨输入数据的长度太小(2) - 并且只有在我在两者之间添加这个之后才能工作:
使用声音文件 0.10.3.post1 和 librosa 0.8.1
python - 使用 soundfile&librosa 生成 mel 频谱图,但它会生成额外的输出
我使用 soundfile 生成 wav 文件,并使用 librosa 提取 mel 谱图。这是代码:
但打印的是 (96, 801)。我认为它的输出应该是 (96,800),而不是 (96,801),因为 (16000/160)*8=800。我想知道为什么。