4

我正在做一个交通流量预测,我可以预测一个地方的交通繁忙或轻微。我将每个流量分类为 1-5,1 是最轻的流量,5 是最重的流量。

我遇到了这个网站http://www.waset.org/journals/waset/v25/v25-36.pdf,AdaBoost 算法,我真的很难学习这个算法。特别S是在集合 (( xi, yi), i=(1,2,…,m)) 的部分。哪里Y={-1,+1}。什么是xy常数L?的价值是L多少?

有人可以解释一下这个算法吗?:)

4

1 回答 1

4

S={(x1,y1),...,(xm,ym)}:每一(x,y)对都是用于训练(或测试)分类器的样本:

  • x= 描述此特定样本的特征,例如列出amount of cars on the roadday of the week等的值
  • y=特定的标签x,在您的情况下可以是1, 2, 3, 4 or 5

Table 1在论文中展示了他们使用的特征,x即:DAYTIMEINTDETLINKPOSGREDIS和。表格的最后一列显示了标签 ( ),他们将其设置为or (ie, or )。表中的每一行都是 1 个样本。VOLOCCy1-1yesno

L是 AdaBoost 训练弱学习器的轮数(在论文Random Forests中用作弱分类器)。如果设置L为,1那么 AdaBoost 将运行 1 轮,并且只会训练 1 个弱分类器,这将产生不好的结果。使用不同的值进行多次实验L以找到最佳值(即,当 AdaBoost 收敛或开始过度拟合时)。

于 2012-08-06T11:55:21.950 回答