我有一个包含许多行和 28 列的数据集。
subject ID
我需要和列的唯一组合coc#
,并且可能被删除的数据放入额外的列中。我可能没有很好地解释这一点,所以我将展示我的例子:
ID DOB address name date seen txdone coc#
1 1/08/1997 4blelan bob sager 19/05/2002 1125 45555
1 1/08/1997 4blelan bob sager 19/05/2002 1200 45555
1 1/08/1997 4blelan bob sager 20/06/2003 2000 46666
1 1/08/1997 4blelan bob sager 20/06/2003 1222 46666
2 5/09/1956 55lala Jim reads 19/05/2002 1125 55544
2 5/09/1956 55lala Jim reads 19/05/2002 1111 55544
2 5/09/1956 55lala Jim reads 1/06/2002 1111 55544
2 5/09/1956 55lala Jim reads 2/07/2002 1353 56678
变成了这个
ID DOB address name dateseen1 txdone1 coc#1 dateseen2 txdone2 coc#2 date seen3 txdone3 coc#3
1 1/08/1997 4blelan bob sager 19/05/2002 1125 45555 19/05/2002 1200 45555
1 1/08/1997 4blelan bob sager 20/06/2003 2000 46666 20/06/2003 1222 46666
2 5/09/1956 55lala Jim reads 19/05/2002 1125 55544 19/05/2002 1111 55544 1/06/2002 1111 55544
2 5/09/1956 55lala Jim reads 2/07/2002 1353 56678
这样做的原因是我可以在其中搜索1125
,但也可以在一行txdone
中获得在其中进行的其他工作。COC
现在看它,我什至不需要coc
一个多列——但你明白了(也许)。
如果我倒退的话,我很愿意以不同的方式做事。但是,我仅限于使用 R 和 Excel。