我录制了一些音频
sd.rec(frames=int(duration * fs), samplerate=fs, channels=2, dtype='float32')
这返回了一个 dtype np.float32 的 numpy 数组。
当录制一些鼓掌声(即相当响亮的噪音)时,最小值和最大值分别在 -14.0 和 14.0 左右。这是什么格式?它似乎与scipy.io.wavfile.read中列出的任何格式都不对应。我需要知道范围,以便将其缩放到 [-1, 1]。
我录制了一些音频
sd.rec(frames=int(duration * fs), samplerate=fs, channels=2, dtype='float32')
这返回了一个 dtype np.float32 的 numpy 数组。
当录制一些鼓掌声(即相当响亮的噪音)时,最小值和最大值分别在 -14.0 和 14.0 左右。这是什么格式?它似乎与scipy.io.wavfile.read中列出的任何格式都不对应。我需要知道范围,以便将其缩放到 [-1, 1]。