问题标签 [soundfile]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

36 问题

0 投票

1 回答

71 浏览

python - 将 .wav 读取为字节

我正在使用 2 个工具在 Python 中读取 .wav 文件。首先 - 带模块soundfile：

结果我得到了这样的字节数据。这是正确的：

然后我用模块阅读 .wav wave：

结果字节完全不正确：

为什么两个不同的工具没有给出相同的结果？如何从第一个字节对象制作第二个字节对象？事实上，我不能使用wave's 字节，因为它与原始音轨完全不同。

python wav wave soundfile

2021-09-22T21:03:59.823

0 投票

1 回答

1031 浏览

python - Python 的 SoundFile：soundfile.write 和剪辑

假设我使用 Python 读取 WAV 文件soundfile，

数组x在float32和中max(x) = 1, min(x) = -1。也就是说：每个样本x都是 -1 和 1 之间的 float32 数字。我对其进行一些操作并得到y. 现在我想保存y到 WAV 文件。假设y现在的值大于 1（和/或小于 -1），我使用

SoundFile 如何处理超出的值？它是否进行削波（如果y[t] > 1需要y[t] = 1）或归一化（将整个信号除以max(abs(y))）或其他什么？

我没有在文档中找到答案：https ://pysoundfile.readthedocs.io/en/latest/#soundfile.write

输出是：

因此，它似乎确实会进行剪辑，但我想确定一下。我可以控制如何soundfile.write处理超值吗？

python audio soundfile

2021-09-30T08:08:46.393

0 投票

1 回答

38 浏览

python - 在音频文件上对我的机器学习模型进行单元测试时出错

我在训练我的机器学习模型时遇到错误，该模型用于检查一个人在说某事时的感受。我正在使用来自 sklearn 的 librosa、soundfile 和 MLPClassifier。这是我的代码：

这是我得到的错误，当我尝试通过其他方法（如使用 pydub ）删除它时，我得到不同类型的错误。我是这方面的初学者，仍然需要学习很多东西。所以我希望能找到解决这个问题的方法。

python machine-learning scikit-learn librosa soundfile

2021-11-15T21:01:07.767

0 投票

1 回答

25 浏览

python - 重新采样音频文件不会产生预期的结果

我想将 32000 KHz 的录音重新采样到 16000 KHz。我已经用下面的代码做到了这一点。但是输出音频有些混乱。

您可以在以下文件夹中找到原始音频以及输出 https://drive.google.com/drive/folders/1vr-ib8zvZagH_QeE4JSUtAUpp3EG75va

任何想法我做错了什么？

python librosa soundfile

2021-11-18T05:22:19.843

0 投票

0 回答

34 浏览

python - python soundfile.read() 返回（通道 x 帧）数组

只是我，还是立体声文件的 soundfile.read() 尺寸改变了，或者 librosa.to_mono() ？

我的代码不再工作 - to_mono 抱怨输入数据的长度太小（2） - 并且只有在我在两者之间添加这个之后才能工作：

使用声音文件 0.10.3.post1 和 librosa 0.8.1

python librosa soundfile

2021-12-27T16:19:17.173

0 投票

0 回答

4 浏览

python - 使用 soundfile&librosa 生成 mel 频谱图，但它会生成额外的输出

我使用 soundfile 生成 wav 文件，并使用 librosa 提取 mel 谱图。这是代码：

但打印的是 (96, 801)。我认为它的输出应该是 (96,800)，而不是 (96,801)，因为 (16000/160)*8=800。我想知道为什么。

python librosa soundfile

2022-03-06T05:17:54.210

1 2 3 4 5 6 7 8 9 10