问题标签 [soundfile]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 执行命令提取 mfcc 后返回什么?
我一直在学习声音分析,并且在其中遇到了术语 mfcc。所以当我执行时,
librosa.feature.mfcc(y=X, sr=sample_rate, n_mfcc=40)
我得到了形状为 40 x 216 的 numpy 数组。所以我知道我已经在 216 帧中提取了 40 个特征。但是在这里,帧的确切含义是什么,它类似于采样率以及我们在加载音频文件时定义它的位置。
audio - 原始声音文件编辑器,8 位
我想知道是否有人知道如何打开和编辑原始声音文件(原始无符号 8 位)。我正在制作自己的游戏并尝试创作原创的 8 位音乐。我无法打开 SoX,并且我拥有的所有其他编辑器都无法正确播放这些频率。我感谢所有帮助。
python - 尝试使用 python-sounddevice 较低级别的“流”类来播放和记录 NumPy 数组给出错误
我正在尝试将音频文件拆分为给定数量的 NumPy 块并将它们放入 RAM 中播放,就像play_a_very_long_sound_file一样。不幸的是,我相信我缺乏对 NumPy 数组和音频文件的一般知识。一旦这段代码工作,我想在回调函数中添加一个录制过程。使用我目前拥有的代码,我得到:
这发生在if
回调函数的第二个块中。我正在尝试在outdata
块的末尾添加零,但不确定如何去做。
另一个奇怪的事情是我只得到一个从 numpy 返回的数组soundfile.read()
,它通常返回一个 numpy 数组和一个采样率。但我假设这是由于我将其分解为框架造成的。
python-3.x - 使用 AudioSegment.export() 编写的 WAV 文件听起来是使用 Soundfile.write 重写文件时速度的一半
我目前正在处理一些音频数据。我有一个音频文件,它是通过使用 pydub 将较大的文件拆分为静音而创建的。
但是,如果我在使用 pydub 导出此音频文件后将其获取,然后将 AudioSegment 的数组转换为 numpy 数组,并使用 soundfile 重新写入,我得到的音频文件写入速度约为原来的一半。可能出了什么问题?
python - Soundfile 以两种不同的格式导入音频
我正在尝试使用 预处理要在神经网络中使用soundfile.read()
的音频文件,但是对于具有相同采样率和长度的不同 .FLAC 文件,该函数对返回的数据进行了不同的格式化。例如,调用data, sr = soundfile.read(audiofile1)
生成一个具有形状的数组data.shape = (48000, 2)
(其中单个元素的值是幅度,0 或 NumPy float64 中的负幅度),而调用data, sr = soundfile.read(audiofile2)
生成一个具有形状的数组data.shape = (48000,)
(其中单个元素的值在 NumPy float64 中变化)。
此外,如果有帮助的话,audiofile1
是从通过 PyAudio 拍摄的录音中提取的录音,而是audiofile2
来自 LibriSpeech 语料库的样本。
所以,我的问题是双重的:
为什么会soundfile.read()
产生两种不同的数据格式,如何确保该函数将来返回相同格式的数组?
python - 保存 .wav 文件时出现随机系统错误
我有一个脚本,可以加载、重新采样、重命名音频数据并将其保存到新的(或相同的)位置。
在过去的两天里,我一直在尝试在 Google Cloud 上运行这个脚本。对于 8 个 CPU,此操作大约需要 8 小时。我今天有6个小时,它变成了梨形。
不幸的是,我在过程中的某个随机点不断遇到系统错误:
现在,我读到这个系统错误通常是因为文件路径不存在。但是,由于我是在尝试打开文件之前创建文件,所以我认为这是不可能的:
所以,我认为路径错误不是问题,因为它是定义和创建的。
这是完整的脚本:
传递给 的三个辅助函数multiprocessing.Pool
是:
python - 无法正确安装 Librosa(sndfile.dll 没有名为“sf_wchar_open”的属性)
我正在尝试在 Anaconda 环境中安装 librosa,我创建了一个全新并已安装的 librosa,但是即使我重新安装 cffi 包、audioread 等,我仍然会遇到这个问题。我不确定如何解决这个问题。
python - .wav 文件错误:python 中的“AttributeError:‘bytes’对象没有属性‘seek’”
我正在尝试遍历大量音频文件,并希望将它们切成 5 秒的片段。
该问题的相关代码如下。
我收到一个错误:“AttributeError:'bytes' 对象没有属性 'seek'”
我很欣赏该文件是字节格式的,但是我尝试将其转换为字符串等,但没有成功,因为这样做时出现权限被拒绝错误。
docker - 在 docker 容器上安装 libsndfile1
我正在尝试在我的 docker 容器上通过 pip install 安装声音文件。可悲的是我需要自己libsndfile1
手动安装apt get
。这以某种方式失败了,我真的不明白为什么,有人知道如何安装它。
我在 Win10 上运行 docker desktop - 但容器最终将在 Linux 机器上运行。
有人知道吗?
audio - 为什么 librosa 加载会更改 flac 文件?
我有一个原始文件0.flac
,我只是用它打开librosa
然后另存SoundFile
为1.flac
:
但是文件大小和文件本身似乎已更改:
元数据块较少,最大帧大小不同。这可能是什么原因?通过 librosa 加载文件是否有损?