190

在对音频或图像数组进行一些处理后,需要在一定范围内对其进行归一化,然后才能将其写回文件。这可以这样做:

# Normalize audio channels to between -1.0 and +1.0
audio[:,0] = audio[:,0]/abs(audio[:,0]).max()
audio[:,1] = audio[:,1]/abs(audio[:,1]).max()

# Normalize image to between 0 and 255
image = image/(image.max()/255.0)

有没有一种不那么冗长、方便的功能方法来做到这一点?matplotlib.colors.Normalize()似乎没有关系。

4

8 回答 8

179
audio /= np.max(np.abs(audio),axis=0)
image *= (255.0/image.max())

使用/=and*=允许您消除中间临时数组,从而节省一些内存。乘法比除法便宜,所以

image *= 255.0/image.max()    # Uses 1 division and image.size multiplications

略快于

image /= image.max()/255.0    # Uses 1+image.size divisions

由于我们在这里使用基本的 numpy 方法,我认为这是 numpy 中尽可能有效的解决方案。


就地操作不会更改容器数组的 dtype。由于所需的标准化值是浮点数,因此audioimage数组需要在执行就地操作之前具有浮点数据类型。如果它们还不是浮点 dtype,则需要使用astype. 例如,

image = image.astype('float64')
于 2009-11-14T18:22:58.190 回答
108

如果数组同时包含正数据和负数据,我会选择:

import numpy as np

a = np.random.rand(3,2)

# Normalised [0,1]
b = (a - np.min(a))/np.ptp(a)

# Normalised [0,255] as integer: don't forget the parenthesis before astype(int)
c = (255*(a - np.min(a))/np.ptp(a)).astype(int)        

# Normalised [-1,1]
d = 2.*(a - np.min(a))/np.ptp(a)-1

如果数组包含nan,一种解决方案可能是将它们删除为:

def nan_ptp(a):
    return np.ptp(a[np.isfinite(a)])

b = (a - np.nanmin(a))/nan_ptp(a)

但是,根据具体情况,您可能希望nan区别对待。例如,插入值,用例如 0 替换 in,或引发错误。

最后,值得一提的是,即使这不是 OP 的问题,标准化

e = (a - np.mean(a)) / np.std(a)
于 2017-07-08T07:08:17.530 回答
42

您也可以使用重新缩放sklearn。优点是除了对数据进行均值居中之外,您还可以调整标准偏差的标准化,并且您可以在任一轴上、按特征或按记录执行此操作。

from sklearn.preprocessing import scale
X = scale( X, axis=0, with_mean=True, with_std=True, copy=True )

关键字参数axis,with_meanwith_std不言自明的,并以其默认状态显示。如果参数copy设置为 ,则参数就地执行操作False。文档在这里

于 2014-01-17T20:53:11.047 回答
16

您正在尝试最小-最大缩放audio-1 和 +1image之间以及 0 和 255 之间的值。

使用sklearn.preprocessing.minmax_scale, 应该可以轻松解决您的问题。

例如:

audio_scaled = minmax_scale(audio, feature_range=(-1,1))

shape = image.shape
image_scaled = minmax_scale(image.ravel(), feature_range=(0,255)).reshape(shape)

注意:不要与将向量的范数(长度)缩放到某个值(通常为 1)的操作相混淆,这通常也称为归一化。

于 2019-04-05T01:08:49.797 回答
11

您可以使用“i”(如 idiv、imul..)版本,它看起来还不错:

image /= (image.max()/255.0)

对于另一种情况,您可以编写一个函数来按列规范化 n 维数组:

def normalize_columns(arr):
    rows, cols = arr.shape
    for col in xrange(cols):
        arr[:,col] /= abs(arr[:,col]).max()
于 2009-11-14T18:04:54.653 回答
6

This answer to a similar question解决了我的问题

np.interp(a, (a.min(), a.max()), (-1, +1))
于 2021-04-24T16:12:20.480 回答
5

一个简单的解决方案是使用 sklearn.preprocessing 库提供的缩放器。

scaler = sk.MinMaxScaler(feature_range=(0, 250))
scaler = scaler.fit(X)
X_scaled = scaler.transform(X)
# Checking reconstruction
X_rec = scaler.inverse_transform(X_scaled)

错误 X_rec-X 将为零。您可以根据需要调整 feature_range,甚至使用标准缩放器 sk.StandardScaler()

于 2018-02-21T14:59:57.967 回答
3

我试着按照这个,得到了错误

TypeError: ufunc 'true_divide' output (typecode 'd') could not be coerced to provided output parameter (typecode 'l') according to the casting rule ''same_kind''

numpy我试图规范化的数组是一个数组integer。似乎他们不赞成在版本中进行类型转换 > 1.10,您必须使用它numpy.true_divide()来解决这个问题。

arr = np.array(img)
arr = np.true_divide(arr,[255.0],out=None)

img是一个PIL.Image对象。

于 2018-05-14T06:50:29.667 回答