我有一个数组
a <- c(1,1,1,1,1,2,3,4,5,5,5,5,5,6,7,7,7,7)
我想使用一些命令来告诉我哪个是数组中最常见的数字?
有一个简单的命令吗?
该table()
功能足以满足此要求,如果您的数据具有多个模式,则该功能特别有用。
考虑以下选项,所有与table()
和相关max()
。
# Your vector
a = c(1,1,1,1,1,2,3,4,5,5,5,5,5,6,7,7,7,7)
# Basic frequency table
table(a)
# a
# 1 2 3 4 5 6 7
# 5 1 1 1 5 1 4
# Only gives me the value for highest frequency
# Doesn't tell me which number that is though
max(table(a))
# [1] 5
# Gives me a logical vector, which might be useful
# but not what you're asking for in this question
table(a) == max(table(a))
# a
# 1 2 3 4 5 6 7
# TRUE FALSE FALSE FALSE TRUE FALSE FALSE
# This is probably more like what you're looking for
which(table(a) == max(table(a)))
# 1 5
# 1 5
# Or, maybe this
names(which(table(a) == max(table(a))))
# [1] "1" "5"
如评论中所述,在某些情况下,您可能希望查看两个或三个最常出现的值,在这种情况下sort()
很有用:
sort(table(a))
# a
# 2 3 4 6 7 1 5
# 1 1 1 1 4 5 5
您还可以设置要在表中返回的值的阈值。例如,如果您只想返回那些多次出现的数字:
sort(table(a)[table(a) > 1])
# a
# 7 1 5
# 4 5 5
使用table()
功能:
## Your vector:
a <- c(1,1,1,1,1,2,3,4,5,5,5,5,5,6,7,7,7,7)
## Frequency table
> counts <- table(a)
## The most frequent and its value
> counts[which.max(counts)]
# 1
# 5
## Or simply the most frequent
> names(counts)[which.max(counts)]
# [1] "1"
我写了一些个人代码来查找模式和更多内容(几年前。正如阿南达所展示的,这是非常明显的东西):
smode<-function(x){
xtab<-table(x)
modes<-xtab[max(xtab)==xtab]
mag<-as.numeric(modes[1]) #in case mult. modes, this is safer
#themodes<-names(modes)
themodes<-as.numeric(names(modes))
mout<-list(themodes=themodes,modeval=mag)
return(mout)
}
Blah blah 版权所有 blah blah 随心所欲地使用,但不要从中赚钱。
您想要的是数据的模式:计算它有多种不同的选项。modeest 包有一组用于模式估计的函数,但对于你想要的可能有点过分了。
也可以看看:
希望有帮助