28

假设您有一个名为 data 的数据框,其中包含两个相同的列:

A B
1 1
2 2
3 3
4 4

如何检查这两列是否相同并返回一个逻辑值来表示它?一个非常基本的伪代码是:

if(data$A == data$B)
{
   print("Column A and B are identical")
}

我一直在搞砸这件事,但还没有找到一种方法来做到这一点,看起来并没有不必要的复杂。谢谢。

4

3 回答 3

37

你可以使用identical

identical(DT[['A']],DT[['B']])
于 2013-04-10T05:47:08.530 回答
29

你可以使用all()

> data <- data.frame(A=c(1,2,3,4), B=c(1,2,3,4))
> all(data$A == data$B)
[1] TRUE
于 2013-04-10T05:45:21.580 回答
4

对于您的问题,这可能是多余的,但您可能还想compare()从“比较”包中查看。考虑以下示例:

> data <- data.frame(A = c(1, 2, 3, 4), B = c(1, 2, 3, 4))
> compare(data[1], data[2]) ## Should be false
FALSE [TRUE]
> compare(data[1], data[2], ignoreNames = TRUE) # Allow different names
TRUE
  dropped names
> data <- data.frame(A = c(1, 2, 3, 4), B = as.character(c(1, 2, 3, 4)))
> str(data) ## "B" is now a factor, so use `coerce` to test for equality
'data.frame':   4 obs. of  2 variables:
 $ A: num  1 2 3 4
 $ B: Factor w/ 4 levels "1","2","3","4": 1 2 3 4
> compare(data[1], data[2], ignoreNames = TRUE, coerce = TRUE)
TRUE
  [A] coerced from <factor> to <numeric>
  dropped names

有一个通用的逻辑参数 ,allowAll可以设置TRUE为允许compare函数尝试不同的转换来测试是否相等。

于 2013-04-10T06:52:22.117 回答