我对 R 和编程本身还是很陌生,现在我的 data.frame 存在问题,不允许我继续工作。
我有一组数据如下
表格1
Individual Score
Tim 45
Tim 77
Tim 32
Clare 92
Clare 70
Clare 88
让我解释一下上面的表 1,我有几个人(上例中的 TIm 和 Clare),我在他们在 3 个不同场合(2009 年、2010 年、2011 年)提出的测试中获得了他们的分数我正在想办法把上面的变成这样的:
表2
Individual Score09 Score10 Score11
Tim 45 77 32
Clare 92 70 88
我使用ddply获取表1,因为我原来有测试的子集的信息(变量分数只是所有子集的总和)
请让我知道是否有办法以表 2 而不是表 1 结束,因为我有超过 10000 个观察结果,并且表 1 的设置不会让我按照预期的建议继续前进。
编辑:
生成表 1 的原始 df 是:
数据框如下
Base Individual score_math score_bio score_chem
SB1120091 Tim 12 23 10
SB1120092 Tim 30 25 22
SB1120101 Tim 17 5 10
SB1120091 Clare 50 20 22
SB1120092 Clare 40 10 20
SB1120101 Clare 47 20 21
代码是:
>Table1 <-ddply(x, .(Indivual), summarise, Score=(score_math*score_bio*score_chem))
编辑2:
原始数据集没有 Year 变量,但有一个基本变量,提供有关何时进行测试的信息。
此外,分数变量是作为所有子集分数的乘积计算的。