对于我的研究生课程的作业,我被要求从英超联赛结果的数据集中提取数据(位于此处)。我非常接近完成,但需要最后两个输出的帮助。
我们必须创建一个可以接收两个参数的函数,一个日期和一个季节。该函数必须返回一个数据框,其中包含该日期相应季节的表格。它必须包括胜负、主场战绩、客场战绩等。我唯一没有弄清楚的是 W/L 连胜和最近 10 场比赛的结果。
以下是初始数据集的示例:
e.Date e.HomeTeam e.AwayTeam e.FTHG e.FTAG e.FTR
1 2015-08-08 Bournemouth Aston Villa 0 1 A
2 2015-08-08 Chelsea Swansea 2 2 D
3 2015-08-08 Everton Watford 2 2 D
4 2015-08-08 Leicester Sunderland 4 2 H
5 2015-08-08 Man United Tottenham 1 0 H
我的计划是整理出每个俱乐部的主场和客场数据,然后将它们合并在一起,然后再进行分析以找到连续和最后 10 个结果。
我操纵数据看起来像这样:
HomeTeam FTR Date freq
1 Arsenal L 2015-08-09 1
2 Arsenal D 2015-08-24 1
3 Arsenal W 2015-09-12 1
4 Aston Villa L 2015-08-14 1
5 Aston Villa L 2015-09-19 1
6 Aston Villa D 2015-08-29 1
现在我有点迷路了。我的想法是运行某种循环(for?ddply?data.table?)为每个俱乐部创建一个数据框,其中包含他们的结果,然后再次循环进行任何计算以获得所需的变量(连续和最后 10 ) 并以某种方式将它们推回到我存放所有其他输出的主数据框中。
我不想直接被告知答案,因为我自己学习这一点很重要。但是,如果有人能指出我正确的方向,那就太好了。非常感谢。