0

我有一个名为 classes 的向量,它是使用列表删除的分析的输出。因此,类中包含的案例是整个数据集的一个子集——有些案例由于数据不完整而被删除。

选择是一个虚拟变量,在我的数据集中的每个案例中都会出现。下面是我的数据的简短示例。每个观察还有一个唯一的案例 ID。

classes <- c(1,2,1,1,1,2,3,3,3,1,1,1,3,3,2,2,2)
selection <- c(1,0,0,0,1,1,1,1,0,0,0,0,0,1,1,1,1,0,0,0,1,1,1,0,1,0)
case <-seq(1,26,1)

我想创建一个新版本的选择(例如 selection2),以便它只包括类中的案例。基本上,出于比较目的,我希望两个变量的长度相同,其中未包含在类中的案例也不包含在 selection2 中。

我认为这很容易解决,但我花了很多时间无处可去,所以我想我会问。提前致谢!

4

1 回答 1

0

如果它们的长度相同,那么简化版本必须具有 NA:

> selection2 <- selection
> is.na(selection2) <- !selection2 %in% classes
> selection2
 [1]  1 NA NA NA  1  1  1  1 NA NA NA NA NA  1  1  1  1 NA NA NA  1  1  1 NA  1 NA
于 2012-05-17T04:31:14.750 回答