我有一个大数据框(大约 1,000 行和 30,000 列),如下所示:
chr pos sample1 sample2 sample3 sample 4
1 5050 1 NA 0 0.5
1 6300 1 0 0.5 1
1 7825 1 0 0.5 1
1 8200 0.5 0.5 0 1
其中在给定的“chr”和“pos”处,给定样本的值可以采用 0、0.5、1 或 NA 的形式。我要执行大量查询,这些查询需要根据每个样本的值的摘要对数据框进行子集化和排序。
我想计算每列给定值(例如0.5)的出现次数,并将其保存为我的数据框中的新行。我的最终目标是能够使用新行的值来对我的数据框的列进行子集化和/或排序。我已经看到有关计数出现的类似问题,但我似乎无法找到/识别一种解决方案来同时在所有列中执行此操作并将特定值的列计数保存为新行。