0

我在逻辑回归之前对我的数据进行特征缩放。

在我尝试将列除以 max_min 向量之前,一切都很完美。它似乎在每一列中都有效,但在年龄列中无效,但我似乎找不到原因。

我之前已经拆分数据进行测试和训练,下面我尝试缩放 X_train 数据。

# Working out the min value for each column and subtracting this from each row in the data
X_train_min = np.array(X_train0.min())
X_train0.sub(X_train_min.squeeze(), axis=1)

从上面的代码中,我获得了一个表,其中每个值都减去了其列的最小值,这是正确的。输出: 输出

# Working out the max value for each column and the difference between the max and min values
X_train_max = np.array(X_train0.max())
max_min = np.array(X_train0.max()) - np.array(X_train0.min())
print(max_min)

输出:

[   56     1     3     2     4     3 18174    56     7]

这是我面临问题的地方:

# Dividing each row in the data by the difference between the max and min values of its column
X_train0.div(max_min, axis=1)

我已经获得了一个表格,其中每个值都除以向量,除了第一列“年龄”,其中数字不对应于除法。输出: 输出

4

1 回答 1

0

您正在除以max - min何时min已经减去。您只需要除以新的最大值:

max_min = np.array(X_train0.max())
于 2020-11-20T17:49:46.247 回答