我有一个包含几列的文件 .ped,我想从中提取信息。这是我的数据示例(没有标题):
1 1 1
1 2 1
2 3 2
3 4 1
3 5 2
...
第一列表示 ID 家族,第二列表示 ID 个人,第三列表示个人性别。
我将表格读取为数据框
ped <- read.table("pedigree.ped", header=FALSE)
我如何计算存在的家庭数量(一个家庭可以出现不止一次,我想将它们视为一个家庭)?我有一个性别列,其中 1 指定男性和 2 女性,我怎样才能得到数据集中男性和女性的分布?
我是 R 的新手,如果你能提供一些代码!
提前致谢。