我有一个庞大的数据集,其中包含来自不同人群的基因型信息。我想按人口对数据进行排序,但我不知道如何。
我想按“pedigree_dhl”排序。我正在使用以下代码,但我不断收到错误消息。
newdata <- project[pedigree_dhl == CCB133$*1, ]
我的问题也是,'pedigree-dhl' 包含各个基因型的所有名称。只有 'pedigree-dhl' 列中的前 7 个字母是种群名称。在此示例中:CCB133。我如何告诉 R,我想提取包含 CCB133 的所有列的数据?
Allele1 Allele2 SNP_name gs_entry pedigree_dhl
1 T T ZM011407_0151 656 CCB133$*1
2 T T ZM009374_0354 656 CCB133$*1
3 C C ZM003499_0591 656 CCB133$*1
4 A A ZM003898_0594 656 CCB133$*1
5 C C ZM004887_0313 656 CCB133$*1
6 G G ZM000583_1096 656 CCB133$*1