1

我的数据由以下对象组成。

Obj1 - 颜色 - 形状 - 尺寸 - 价格 - 排名

所以我希望能够预测颜色/形状/尺寸/价格的组合是获得高排名的好组合。甚至一个组合也可以像这样工作:为了获得良好的排名,算法预测这种颜色和这种形状的最佳性能。类似的东西。

这种预测的可取算法是什么?

也可能是,如果您能简要解释我如何处理模型构建,我将不胜感激。比如说:我的数据看起来像

Blue pentagon small $50.00 #5
Red  Squre    large $30.00 #3

那么我应该看什么有用的预测模型呢?我应该尝试什么算法来预测,比如最高权重是价格,然后是颜色,然后是尺寸。如果我想预测像红色小形状这样的组合,与粉色小形状相比,它的排名不太可能更高。(本质上是试图组合多个标称值列来进行预测)

4

2 回答 2

2

听起来您想学习可以解释为人类的模型。根据您的排名变量的类型,可能有许多不同的学习者。

如果排名是分类的(例如星),分类器可能是最好的。Weka有很多。一些产生人类可以理解的模型的是J48决策树学习器和OneR规则学习器。

如果排名是连续的(例如分数),回归可能更合适。合适的算法是例如SimpleLogisticLinearRegression

或者,您可以尝试使用 Weka 中的任何算法对示例进行聚类,然后分析聚类。也就是说,理想情况下,集群中的示例都具有相同(或非常相似)的排名,您可以查看其他属性的值范围并得出自己的结论。

于 2012-12-19T04:31:41.760 回答
0

将组合视为线性方程,并应用蒙特卡罗算法(如遗传算法)来调整方程的参数。


  1. 将颜色/形状/尺寸/价格/排名编码为数字值。

  2. 将组合视为一个线性方程,比如说a*color + b*shape + c*size + d*price = ranking

  3. 应用遗传算法调整 a/b/c/d,以使计算rankings尽可能接近真实情况。

  4. 最后你得到了方程,你可以用它来:

    1)通过简单的线性规划找到最大排名;

    2)通过分配其他参数来预测排名。

于 2012-12-19T04:30:19.113 回答