我正在基于这个数据集做一些练习。
有一State
栏列出了该州每家医院每月心脏病发作的死亡率(第 11 栏):
> table(data$State)
AK AL AR AZ CA CO CT DC DE FL GA GU HI IA ID IL IN KS KY
17 98 77 77 341 72 32 8 6 180 132 1 19 109 30 179 124 118 96
现在我尝试过滤掉至少有 20 个值可用的这些状态:
> table(data$State)>20
AK AL AR AZ CA CO CT DC DE FL GA GU
FALSE TRUE TRUE TRUE TRUE TRUE TRUE FALSE FALSE TRUE TRUE FALSE
因此,subset
我尝试根据上述条件获取数据子集,但这给了我无法遵循的结果:
> data_subset <- subset(data, table(data$State)>20)
> table(data_subset$State)
AK AL AR AZ CA CO CT DC DE FL GA GU HI IA ID IL IN KS KY
14 84 66 65 288 64 25 8 5 155 109 1 19 93 24 153 107 100 83
AK 14
当我期望该状态被条件过滤掉时,为什么我会得到?