使用identical
. 那就是 R 的“标量”比较运算符;它返回单个逻辑值,而不是向量。
apply(A, 2, identical, a)
# a b c
# TRUE TRUE FALSE
如果A
在您的真实案例中是一个数据框,那么您最好使用sapply
或者vapply
因为apply
强制它输入到矩阵中。
d <- c("a", "b", "c")
B <- data.frame(a, b, c, d)
apply(B, 2, identical, a) # incorrect!
# a b c d
# FALSE FALSE FALSE FALSE
sapply(B, identical, a) # correct
# a b c d
# TRUE TRUE FALSE FALSE
但请注意,data.frame
除非您另有要求,否则会将字符输入强制转换为因子:
sapply(B, identical, d) # incorrect
# a b c d
# FALSE FALSE FALSE FALSE
C <- data.frame(a, b, c, d, stringsAsFactors = FALSE)
sapply(C, identical, d) # correct
# a b c d
# FALSE FALSE FALSE TRUE
Identical 也比使用all
+快得多==
:
library(microbenchmark)
a <- 1:1000
b <- c(1:999, 1001)
microbenchmark(
all(a == b),
identical(a, b))
# Unit: microseconds
# expr min lq median uq max
# 1 all(a == b) 8.053 8.149 8.2195 8.3295 17.355
# 2 identical(a, b) 1.082 1.182 1.2675 1.3435 3.635