0

我刚开始使用 GPy 和 GPyOpt。我的目标是设计一个迭代过程来找到 x 的位置,其中 y 是最大值。虚拟 x 数组从 0 到 100,步长为 0.5。虚拟 y 数组是 x 数组的函数。真正的函数是 y = -x**2 + 50*x + 5,所以 ymax 是 x = 25.0 时。

我通过将 5 个点随机分配给 x 数组(具有相应的 5 个 y 值)开始它,并运行贝叶斯优化以让它推荐下一个采样位置。我可以使用方便的 myBopt.plot_acquistion() 来生成绘图。示例图如下。 在此处输入图像描述 在此处输入图像描述

问题:

(1) 类高斯峰和垂直线是什么意思?他们有什么建议?我假设高斯峰的中心是建议的下一个采样位置,这是正确的吗?

(2)如何找回高斯峰的中心位置?我试图从 myBopt 打印出一些东西,但在任何地方都找不到(如果我知道如何获得这个数字,我可以将它附加到原始列表中以开始另一个 BO 并找到下一个位置,直到收敛)。

(3) 有没有办法检索原始数据以绘制采集函数图?这一定是保存在某个地方的。

(4)我还生成了收敛图(在采集图下),我真的无法理解。有人可以向我解释一下吗?

谢谢。

import GPyOpt
import GPy
from numpy.random import seed
import numpy as np
import matplotlib.pyplot as plt
import random

N = 5
x_array = np.arange(0,100,0.5)
x_random = np.array(sorted(random.sample(x_array, N)))
y_random = (-x_random**2 + 50*x_random + 5) # y = -x**2 + 50*x  + 5

## x_feed and y_feed are the matrices that will be fed into Bayesian Optimization
x_feed = x_random[:, None] # (200, 1)
y_feed = y_random[:, None] # (200, 1)

##creat the objective function
class max_number(object):
    def __init__(self, x_feed, y_feed):
        self.x_feed = x_feed
        self.y_feed = y_feed

    def f(self, x):
        return np.dot(1.0*(x_feed == x).sum(axis = 1), y_feed)[:, None]


func = max_number(x_feed, y_feed)
domain = [{'name' : 'guess_number',
          'type' :  'bandit',
          'domain': x_feed}]

seed(123)
myBopt = GPyOpt.methods.BayesianOptimization(f = func.f,
                                             domain = domain,
                                             acquisition_type = 'EI',
                                             maximize = True,
                                             exact_feval = False,
                                             initial_design_numdata = 5,
                                             verbosity = True)

max_iter = 50
myBopt.run_optimization(max_iter)

myBopt.plot_acquisition()

print 'x random initial points {}'.format(x_random)
print 'y random initial points {}'.format(y_random)
print 'myBopt.X {}'.format(myBopt.X)
print 'myBopt.x_opt {}'.format(myBopt.x_opt)
print 'myBopt.Y {}'.format(myBopt.Y)
print 'myBopt.Y_best {}'.format(myBopt.Y_best)
print 'myBopt.Y_new {}'.format(myBopt.Y_new)
print 'myBopt.suggest_next_locations {}'.format(myBopt.suggest_next_locations())
4

1 回答 1

0

好几个问题。对未来的建议,每个问题都有一个帖子更适合 SO 的格式。但现在:

  1. 垂直的红线表示采集函数建议运行该函数的最后一个点。钟形曲线是整个采集函数图的一部分(注意红线延伸到整y = 0条线) - 它只是绘制采集函数,因此您可以直观地了解最有可能建议下一个点的位置。

  2. 您需要自己优化采集功能。或者,您可以使用BO.suggest_next_locations. 结帐教程笔记本,有一个后者的例子。

  3. 推荐浏览一下源代码plot_acquisition,很清楚用什么数据,如何访问。

  4. 我认为这些情节有非常自我描述的标题。左边的图显示了对目标函数的两次连续调用之间的距离。随着时间的推移,您会期望它会缩小,因为优化会找到最佳值。右侧的图显示了y迄今为止找到的最佳值。随着时间的推移,你会期望它会变平。

于 2018-12-12T13:40:25.710 回答