我正在尝试了解 GPR,并且正在对其进行测试以预测一些值。响应是 PCA 的第一个组成部分,因此它具有相对较好的数据,没有异常值。预测变量也来自 PCA(n=2),但预测变量列已使用 StandardScaler().fit_transform 标准化,正如我在之前的帖子中看到的那样更好。由于预测变量是标准化的,我使用 RBF 内核并将其乘以 1**2,并让超参数适合。问题是该模型非常适合预测变量,并为测试数据提供几乎恒定的值。该集合是一组 463 个点,无论我为训练数据随机化 20-100 还是 200,添加 Whitekernel() 或 alpha 值,我都会得到相同的结果。我几乎可以肯定我做错了什么,但我找不到什么,有什么帮助吗?这里'
k1 = cKrnl(1**2,(1e-40, 1e40)) * RBF(2, (1e-40, 1e40))
k2 = cKrnl(1**2,(1e-40, 1e40)) * RBF(2, (1e-40, 1e40))
kernel = k1 + k2
gp = GaussianProcessRegressor(kernel=kernel, n_restarts_optimizer=10,normalize_y = True)
gp.fit(x_train, y_train)
print("GPML kernel: %s" % gp.kernel_)
输出 :
GPML kernel: 1**2 * RBF(length_scale=0.000388) + 8.01e-18**2 * RBF(length_scale=2.85e-18)
训练数据:
谢谢大家!!!