我想要一种简单的方法来创建一个新变量,以确定 R 数据框中的布尔值是否为真。这是示例:假设在数据集中我有 2 个变量(以及其他不相关的变量)“a”和“b”和“a”确定一个组,而“b”是一个布尔值,值为 TRUE (1)或假 (0)。我想创建一个变量“c”,对于“b”至少一次为“真”的组中的所有条目,它也是一个布尔值,为 1,对于“b”从不为真的组中的所有条目,它为 0。从以下条目中:
a b
-----
1 1
2 0
1 0
1 0
1 1
2 0
2 0
3 0
3 1
3 0
我想得到变量'c',如下所示:
a b c
-----------
1 1 1
2 0 0
1 0 1
1 0 1
1 1 1
2 0 0
2 0 0
3 0 1
3 1 1
3 0 1
-----------
我知道如何在 Stata 中做到这一点,但我还没有在 R 中做过类似的事情,而且很难在互联网上找到这方面的信息。事实上,我这样做只是为了以后删除“c”为 0 的所有观察结果,所以任何其他建议也可以。它的应用与多项式 logit 估计有关,其中从未选择过的替代方案需要在估计之前从数据集中删除。