0

我正在寻找可用于模拟特定 SNP 和定量表型之间的遗传关联的最佳方法或最佳软件包,模拟数据与我的真实数据最相似,除了我知道因果变异。我在 R 中看到的所有软件包似乎都专门用于谱系数据或指定了合并和其他进化因素的种群数据,但我没有任何种群遗传学经验,我只想模拟欧洲的简单案例与我的真实数据具有相似特征的人群(即性状的正态分布和基因型的加性效应,相似的等位基因频率……)例如,如果我的遗传数据是 X,我的定量变量是 Y:

X <-rbinom(1000,2,0.4)
Y <- rnorm(1000,1,0.4)

我在 R 中寻找类似于 Plink 中的函数的东西,其中需要指定等位基因频率的范围、表型的范围,并指定应该与基因型相关的特定变体(这很重要,因为我需要在不同的数据集中重复这些关联,因果变量相同)

有人可以帮帮我吗?

4

1 回答 1

1

如果基因型只改变表型的平均值,这很简单。

phenotype.means <- c(5, 15, 20)  # phenotype means for genotypes 0, 1, and 2
phenotype.sd <- 5
X <- rbinom(1000,2,0.4)
Y <- rnorm(1000, phenotype.means[X], phenotype.sd)

这将导致Y包含 1000 个正态分布变量,其中具有纯合隐性基因型 (aa或 0) 的变量的平均值为 5,具有杂合基因型 (Aa或 1) 的变量平均值为 15,而具有纯合显性基因型的变量平均值为(AA或 2) 的平均值为 20。

如果您想要更传统的 2 设置表型(AA/Aaaa),只需设置phenotype.meansc(5, 20, 20).

于 2012-09-03T07:20:36.883 回答