我有以下数据框df
(虚构数据),其中包含几个变量var1
, var2
, ..., var_n
:
var1<-c("A","A","A","B","A","C","C","A", "A", "E", "E", "B")
var2<-c(NA,"1","1","5","6","2","3","1", "1", "3", "3", "2")
id<-c(1,2,2,3,3,4,4,5,5,6,6,7)
df<-data.frame(id, var1, var2)
df
id var1 var2
1 A <NA>
2 A 1
2 A 1
3 B 5
3 A 6
4 C 2
4 C 3
5 A 1
5 A 1
6 E 3
6 E 3
7 B 2
数据是从文档分析中检索出来的,其中几个编码人员从物理文件中提取了值。每个文件都有一个特定的id
. 因此,如果有两个相同的条目,id
这意味着两个不同的编码器对同一个文档进行了编码。例如在文件号中。4 两位编码员都同意 var1 的值为 C,而在文档中没有。3 有异议(A 对 B)。
为了计算评估者间可靠性(irr),我需要按如下方式重组数据帧:
id var1 var1_coder2 var2 var2_coder2
2 A A 1 5
3 B A 5 6
4 C C 2 3
5 C C 1 1
6 E E 3 3
谁能告诉我如何完成这项工作?谢谢!