我想知道根据某些标准选择列的命令。例如,假设我有一个 N+5 列数据框(其中 N 是任意/未知),如下所示:
>mydf
Name Meta1 Meta2 ... MetaN A B C D
Alice a1 a2 ... aN 1 0 1 0
Bob b1 b2 ... bN 2 1 2 1
我想通过使用 A 和 C 的列均值大于 1(或等效地 B 和 D 的列均值小于 1)这一事实来获得下面的数据框。
>mydf
Name Meta1 Meta2 ... MetaN A C
Alice a1 a2 ... aN 1 1
Bob b1 b2 ... bN 2 2
我尝试将子集命令的“选择”选项与逻辑操作和 colMeans 命令结合使用,但无济于事。总的来说,我最接近做到这一点的方法非常复杂。我尝试寻找可以优雅地执行此操作的命令,但还没有找到。
编辑:列名“Meta1”到“MetaN”应该被认为是占位符,不一定是列的实际名称。出于所有意图和目的,它们可以是 N 个随机颜色名称。