1:我想创建一个包含 14.000 个基因(行)和 250 个样本(矩阵列)的合成数据集。如何做到这一点?
2:在此之后,我想用互信息的ex算法来推断基因调控。我知道如何并且事实上我有一个网络。
3:我想知道我得到的网是不是偶然的。为此,一种常见的方法是将样本或基因混洗 1000 次,以创建 1000 个网络并绘制一个空分布以验证您之前获得的网络(第 2 点)。这称为引导程序。还有其他方法吗?
最好的,
E.
1:我想创建一个包含 14.000 个基因(行)和 250 个样本(矩阵列)的合成数据集。如何做到这一点?
2:在此之后,我想用互信息的ex算法来推断基因调控。我知道如何并且事实上我有一个网络。
3:我想知道我得到的网是不是偶然的。为此,一种常见的方法是将样本或基因混洗 1000 次,以创建 1000 个网络并绘制一个空分布以验证您之前获得的网络(第 2 点)。这称为引导程序。还有其他方法吗?
最好的,
E.
R中的sample
函数是构造现有数据的随机排列的基本方法。不清楚你想要什么,另外一个想法是你可能只需要指向runif
生成随机统一序列的函数。如果在一个对象向量中有 1000 个特定类型的对象,obj:
sample( obj ) # returns a permuted sequence
# Same as ...
obj[ sample(length(obj)) ]
这是否是“零分布”由您决定。(并且要求“所有”方法来完成 R 中的任何特定任务将被视为要求过高。通常有大量方法,即使要求“最好”也会增加你获得你的问题已结束。)