我使用RapidMiner,我有一个包含 40 行的数据集,每行有 14 列。行是Android应用程序的不同类型的指标+,行尾是google-play排名(第一行是包含指标名称的标题)。
(所以目标是根据指标预测 google play 排名。)
数据集: http: //pastebin.com/Cw1BR4K6
- 第 1-13 列:不同类型的指标
- 第十四栏:google play排名
- 第 2-40 行:Android 项目的指标
我在 RapidMiner 中使用了PolynomialRegression ,我得到了这个结果:
- 6.723 * lloc ^ 1.000
+ 1.187 * nid ^ 2.000
- 47.730 * nle ^ 1.000
- 36.433 * nel ^ 1.000
- 1.466 * nip ^ 2.000
- 97.187 * activites ^ 1.000
- 50.080 * inside-permissions ^ 1.000
- 60.291 * outside-permissions ^ 1.000
- 52.472 * all-permissions ^ 4.000
- 2.309 * jtlloc ^ 1.000
+ 36.058 * jtnm ^ 1.000
+ 9.924 * jtna ^ 1.000
+ 40.504 * jtncl ^ 1.000
+ 9.455
我的问题: 我如何检查这个结果是否正确?如何将此结果检查到已经可用的线路?例如,我想将此结果应用于第 25 行:25,8,5,10,0,1,0,0,0,239,10,14,4,3.8
我的另一个问题: 我可以用什么方法来预测这个集合?最好的方法是什么?如果可能的话,我想请你向我解释一下。
在此先感谢,彼得