求解倒立摆的适应度函数是什么?
我正在用遗传算法进化神经网络。我不知道如何评价每个人。
我尝试在评估时间(10 秒)结束时最小化钟摆的角度并最大化行进的距离,但这不起作用。
神经网络的输入是:推车速度、推车位置、摆锤角速度和时间 (t) 的摆锤角度。输出是在时间 (t+1) 施加的力
提前致谢。
求解倒立摆的适应度函数是什么?
我正在用遗传算法进化神经网络。我不知道如何评价每个人。
我尝试在评估时间(10 秒)结束时最小化钟摆的角度并最大化行进的距离,但这不起作用。
神经网络的输入是:推车速度、推车位置、摆锤角速度和时间 (t) 的摆锤角度。输出是在时间 (t+1) 施加的力
提前致谢。
我发现这篇论文将它们的目标函数列为:
定义为:
其中“Xmax = 1.0, thetaMax = pi/6, _X'max = 1.0, theta'Max = 3.0, N 是迭代步数,T = 0.02 * TS 和 Wk 是选择的正权重。” (但是,使用论文中的角度、速度和位置的特定值,您将需要根据钟摆的边界条件使用自己的值)。
该论文还指出“第一项和第二项确定 X1 和 X3 与零的归一化绝对偏差的累积总和,第三项最小化时,最大化生存时间。”
这应该足以开始,但我强烈建议您阅读整篇论文。这是一本很棒的书,我发现它很有教育意义。
您可以制作自己的适应度函数,但我认为使用摆锤的位置、速度、角度和角度变化率的想法对于适应度函数来说是一个好主意。但是,您可以选择以与论文作者选择对其功能建模的方式截然不同的方式使用这些变量。
阅读谐波振荡器也无妨。它们采用一般形式:
m x" + B x' -k x = A cos(w*t)
(其中 B 或 A 可能为 0,具体取决于振荡器是否分别为阻尼/无阻尼或驱动/无驱动)。