0

我正在做一个项目,我需要根据篮球运动员过去的统计数据来预测未来的统计数据。我希望能够根据过去三个赛季的统计数据预测下一赛季的统计数据(如果有前三个赛季可供选择)。有没有人建议我可以使用一个好的预测算法?数据是连续的,可以有 5-14 个维度(年龄、分钟、点数等)

谢谢!

注意:我真的很想使用 Weka 程序来做到这一点。

4

2 回答 2

2

开箱即用,随机森林可能会给你一个强大的基线,所以我会从这个开始。

您也可以尝试线性回归,这是一种简单但相对有效的方法,但根据数据可能需要进行更多调整(例如转换一些输入和/或输出变量)。

梯度提升回归是另一个强有力的预测指标,但通常还需要更多的调整才能正常工作。

所有这些算法都有 Weka 实现。

于 2013-04-23T05:29:25.640 回答
0

显然没有一个正确的答案,但对于任何想要做类似事情的人,我会更好地描述我的问题和我找到的解决方案。我创建了一个 csv 文件,其中每一行是不同的季节,每一列包含不同的属性。对于我想预测的每个属性,我都有当前赛季的统计数据,然后是上一赛季统计数据的另一列。对于所有“上一季”列,第一个(新秀)赛季将为 0。有了这个数据集,我将它加载到 Weka 中,并使用了一个多层感知器,并将测试选项设置为交叉验证。我将折叠数设置为可用季节数的 80-90% 之间。

最后,为了预测下一季的统计数据,您在末尾再添加一行,并用“?”输入上一季的值。在您想要预测的列中。如果有人想要更深入的例子,我很乐意提供一个。

于 2013-04-25T23:51:18.493 回答