问题标签 [soundfile]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
93 浏览

python - 执行命令提取 mfcc 后返回什么?

我一直在学习声音分析,并且在其中遇到了术语 mfcc。所以当我执行时, librosa.feature.mfcc(y=X, sr=sample_rate, n_mfcc=40) 我得到了形状为 40 x 216 的 numpy 数组。所以我知道我已经在 216 帧中提取了 40 个特征。但是在这里,帧的确切含义是什么,它类似于采样率以及我们在加载音频文件时定义它的位置。

0 投票
0 回答
23 浏览

audio - 原始声音文件编辑器,8 位

我想知道是否有人知道如何打开和编辑原始声音文件(原始无符号 8 位)。我正在制作自己的游戏并尝试创作原创的 8 位音乐。我无法打开 SoX,并且我拥有的所有其他编辑器都无法正确播放这些频率。我感谢所有帮助。

0 投票
0 回答
516 浏览

python - 尝试使用 python-sounddevice 较低级别的“流”类来播放和记录 NumPy 数组给出错误

我正在尝试将音频文件拆分为给定数量的 NumPy 块并将它们放入 RAM 中播放,就像play_a_very_long_sound_file一样。不幸的是,我相信我缺乏对 NumPy 数组和音频文件的一般知识。一旦这段代码工作,我想在回调函数中添加一个录制过程。使用我目前拥有的代码,我得到:

这发生在if回调函数的第二个块中。我正在尝试在outdata块的末尾添加零,但不确定如何去做。

另一个奇怪的事情是我只得到一个从 numpy 返回的数组soundfile.read(),它通常返回一个 numpy 数组和一个采样率。但我假设这是由于我将其分解为框架造成的。

0 投票
0 回答
1047 浏览

python-3.x - 使用 AudioSegment.export() 编写的 WAV 文件听起来是使用 Soundfile.write 重写文件时速度的一半

我目前正在处理一些音频数据。我有一个音频文件,它是通过使用 pydub 将较大的文件拆分为静音而创建的。

但是,如果我在使用 pydub 导出此音频文件后将其获取,然后将 AudioSegment 的数组转换为 numpy 数组,并使用 soundfile 重新写入,我得到的音频文件写入速度约为原来的一半。可能出了什么问题?

0 投票
2 回答
44 浏览

python - Soundfile 以两种不同的格式导入音频

我正在尝试使用 预处理要在神经网络中使用soundfile.read()的音频文件,但是对于具有相同采样率和长度的不同 .FLAC 文件,该函数对返回的数据进行了不同的格式化。例如,调用data, sr = soundfile.read(audiofile1)生成一个具有形状的数组data.shape = (48000, 2)(其中单个元素的值是幅度,0 或 NumPy float64 中的负幅度),而调用data, sr = soundfile.read(audiofile2)生成一个具有形状的数组data.shape = (48000,)(其中单个元素的值在 NumPy float64 中变化)。

此外,如果有帮助的话,audiofile1是从通过 PyAudio 拍摄的录音中提取的录音,而是audiofile2来自 LibriSpeech 语料库的样本。

所以,我的问题是双重的:

为什么会soundfile.read()产生两种不同的数据格式,如何确保该函数将来返回相同格式的数组?

0 投票
0 回答
612 浏览

python - 保存 .wav 文件时出现随机系统错误

我有一个脚本,可以加载、重新采样、重命名音频数据并将其保存到新的(或相同的)位置。

在过去的两天里,我一直在尝试在 Google Cloud 上运行这个脚本。对于 8 个 CPU,此操作大约需要 8 小时。我今天有6个小时,它变成了梨形。

不幸的是,我在过程中的某个随机点不断遇到系统错误:

现在,我读到这个系统错误通常是因为文件路径不存在。但是,由于我是在尝试打开文件之前创建文件,所以我认为这是不可能的:

所以,我认为路径错误不是问题,因为它是定义和创建的。

这是完整的脚本:

传递给 的三个辅助函数multiprocessing.Pool是:

0 投票
2 回答
1042 浏览

python - 无法正确安装 Librosa(sndfile.dll 没有名为“sf_wchar_open”的属性)

我正在尝试在 Anaconda 环境中安装 librosa,我创建了一个全新并已安装的 librosa,但是即使我重新安装 cffi 包、audioread 等,我仍然会遇到这个问题。我不确定如何解决这个问题。

0 投票
1 回答
803 浏览

python - .wav 文件错误:python 中的“AttributeError:‘bytes’对象没有属性‘seek’”

我正在尝试遍历大量音频文件,并希望将它们切成 5 秒的片段。

该问题的相关代码如下。

我收到一个错误:“AttributeError:'bytes' 对象没有属性 'seek'”

我很欣赏该文件是字节格式的,但是我尝试将其转换为字符串等,但没有成功,因为这样做时出现权限被拒绝错误。

0 投票
1 回答
322 浏览

docker - 在 docker 容器上安装 libsndfile1

我正在尝试在我的 docker 容器上通过 pip install 安装声音文件。可悲的是我需要自己libsndfile1手动安装apt get。这以某种方式失败了,我真的不明白为什么,有人知道如何安装它。

我在 Win10 上运行 docker desktop - 但容器最终将在 Linux 机器上运行。

有人知道吗?

0 投票
0 回答
203 浏览

audio - 为什么 librosa 加载会更改 flac 文件?

我有一个原始文件0.flac,我只是用它打开librosa然后另存SoundFile1.flac

但是文件大小和文件本身似乎已更改:

元数据块较少,最大帧大小不同。这可能是什么原因?通过 librosa 加载文件是否有损?