我有一个data.frame:
head(data)
År Namn N_medlemmar
1 1938 Asea-personalens erk. Csk. 8796
2 1938 Bohuslän-Hallands erk. Csk. 73765
3 1938 Dala-Gäleborgs erk. Csk. 87053
4 1938 De dövstummas erk. Csk. 718
5 1938 Eskilstuna stads erk. Csk. 15657
6 1938 Gefle stads erk. Csk. 9316
我想添加一个Code
具有基于上述条件的唯一值的列Name column
。例如:
År Name N_medlemmar Code
1 1938 Asea-personalens erk. Csk. 8796 1
2 1938 Bohuslän-Hallands erk. Csk. 73765 2
3 1939 Bohuslän-Hallands erk. Csk. 12392 2
4 1940 Dala-Gäleborgs erk. Csk. 87053 3
5 1941 De dövstummas erk. Csk. 718 4
6 1942 Eskilstuna stads erk. Csk. 15657 5
7 1943 Eskilstuna stads erk. Csk. 9316 5
所以该Code
列是一个以Name
上面列为条件的唯一值。
dput(data)
structure(list(År = c(1938L, 1938L, 1938L, 1938L, 1938L, 1938L
), Namn = c("Asea-personalens erk. Csk.", "Bohuslän-Hallands erk. Csk.",
"Dala-Gäleborgs erk. Csk.", "De dövstummas erk. Csk.", "Eskilstuna stads erk. Csk.",
"Gefle stads erk. Csk."), N_medlemmar = c(8796L, 73765L, 87053L,
718L, 15657L, 9316L)), .Names = c("År", "Namn", "N_medlemmar"
), class = "data.frame", row.names = c(NA, 6L))
我尝试循环但没有成功...lapply
有什么建议吗?for
最好的祝福!