我有以下格式的数据 -
ID EVID ADMIT DC DRG CLIN_C PRIN_DX
1 AA 1/1/13 2/1/13 ABC 1A234 Y
1 AA 1/1/13 2/1/13 ABC 1B345 N
1 AA 1/1/13 2/1/13 ABC 1C234 N
1 AA 1/1/13 2/1/13 ABC 1234C N
1 BB 3/1/13 2/15/13 EEE C12C3 Y
1 BB 3/1/13 2/15/13 EEE 1B345 N
1 BB 3/1/13 2/15/13 EEE 1C234 N
1 BB 3/1/13 2/15/13 EEE 987D N
2 CC 3/1/13 2/15/13 EEE C12C3 Y
2 CC 3/1/13 2/15/13 EEE 546X N
2 CC 3/1/13 2/15/13 EEE 1C234 N
2 CC 3/1/13 2/15/13 EEE 1234C N
我想要以下格式的数据:
ID EVID ADMIT DC DRG PRIN_DX 1B345 1C234 1234C 987D 546X
1 AA 1/1/13 2/1/13 ABC 1A234 1 1 1 0 0
1 BB 3/1/13 2/15/13 EEE C12C3 1 1 0 1 0
2 CC 3/1/13 2/15/13 EEE C12C3 0 1 0 0 1
如果可能的话,我想用 R 来做这件事。我尝试过 reshape/reshape2,但找不到处理分组行的明显方法 - 将分组行拆分为列,然后聚合剩余的行。
数据是数百次住院的记录——如此之大是合理的。