3

是否可以计算数据框行中的唯一元素并返回一个出现次数最多的元素,并作为向量的结果。

example:
a a a b b b b -> b 
c v f w w r t -> w
s s d f b b b -> b
4

3 回答 3

4

您可以在数据框的每一行上apply使用table函数。

df <- read.table(textConnection("a a a b b b b\nc v f w w r t\ns s d f b b b"), header = F)

df$result <- apply(df, 1, function(x) names(table(x))[which.max(table(x))])

df
##   V1 V2 V3 V4 V5 V6 V7 result
## 1  a  a  a  b  b  b  b      b
## 2  c  v  f  w  w  r  t      w
## 3  s  s  d  f  b  b  b      b
于 2013-03-17T12:39:16.967 回答
1

是的table

x=c("a", "a", "a", "b" ,"b" ,"b" ,"b")
table(x)
x
a b 
3 4 

用 data.table 编辑

DT = data.table(x=sample(letters[1:5],10,T),y=sample(letters[1:5],10,T))
#DT
#    x y
# 1: d a
# 2: c d
# 3: d c
# 4: c a
# 5: a e
# 6: d c
# 7: c b
# 8: a b
# 9: b c
#10: c d

f = function(x) names(table(x))[which.max(table(x))]
DT[,lapply(.SD,f)]
#   x y
#1: c c
于 2013-03-17T12:31:33.350 回答
1

请注意,如果您想保留所有最大值,则需要明确要求它们。

您可以将它们保存为 data.frame 中的列表。如果每行只有一个,那么列表将被简化为一个公共向量

  df$result <- apply(df, 1, function(x) {T <- table(x); list(T[which(T==max(T))])})

最大的领带:

df2 <- df[, 1:6]
df2$result <- apply(df2, 1, function(x) {T <- table(x); list(T[which(T==max(T))])})

> df2
  V1 V2 V3 V4 V5 V6 result
1  a  a  a  b  b  b   3, 3
2  c  v  f  w  w  r      2
3  s  s  d  f  b  b   2, 2

最大无领带:

df$result <- apply(df, 1, function(x) {T <- table(x); list(T[which(T==max(T))])})

> df
  V1 V2 V3 V4 V5 V6 V7 result
1  a  a  a  b  b  b  b      4
2  c  v  f  w  w  r  t      2
3  s  s  d  f  b  b  b      3
于 2013-03-17T14:36:10.690 回答