在我分析的数据管理步骤中,我遇到了以下问题。
在实践中,每个id
记录最多 5 次,我有一个感兴趣的时变变量,tv = 1, 2, 3, 4
. 假设我的数据是:
dat <- read.table(text = "
id tv
1 2
1 2
1 1
1 4
2 4
2 1
2 4
3 1
3 2
3 3
3 3
3 2",
header=TRUE)
我需要做的是从 开始创建两组新的变量tv
,以获得:
id tv tv1 tv2 tv3 tv4 tv5 dur1 dur2 dur3 dur4 dur5
1 2 2 1 4 0 0 2 1 1 0 0
1 2 2 1 4 0 0 2 1 1 0 0
1 1 2 1 4 0 0 2 1 1 0 0
1 4 2 1 4 0 0 2 1 1 0 0
2 4 4 1 4 0 0 1 1 1 0 0
2 1 4 1 4 0 0 1 1 1 0 0
2 4 4 1 4 0 0 1 1 1 0 0
3 1 1 2 3 2 0 1 1 2 1 0
3 2 1 2 3 2 0 1 1 2 1 0
3 3 1 2 3 2 0 1 1 2 1 0
3 3 1 2 3 2 0 1 1 2 1 0
3 2 1 2 3 2 0 1 1 2 1 0
对于每个id
, in tv1
-tv5
我们有不同(非重复)记录的有序序列tv
,而 in dur1
-dur5
我们有原始数据集中各个不同记录出现的次数dat
。
我真的不知道如何在这里进行。任何帮助将不胜感激。