-2

1:我想创建一个包含 14.000 个基因(行)和 250 个样本(矩阵列)的合成数据集。如何做到这一点?
2:在此之后,我想用互信息的ex算法来推断基因调控。我知道如何并且事实上我有一个网络。
3:我想知道我得到的网是不是偶然的。为此,一种常见的方法是将样本或基因混洗 1000 次,以创建 1000 个网络并绘制一个空分布以验证您之前获得的网络(第 2 点)。这称为引导程序。还有其他方法吗?

最好的,

E.

4

1 回答 1

1

R中的sample函数是构造现有数据的随机排列的基本方法。不清楚你想要什么,另外一个想法是你可能只需要指向runif生成随机统一序列的函数。如果在一个对象向量中有 1000 个特定类型的对象,obj:

 sample( obj )   # returns a permuted sequence
 # Same as ...
 obj[ sample(length(obj)) ]

这是否是“零分布”由您决定。(并且要求“所有”方法来完成 R 中的任何特定任务将被视为要求过高。通常有大量方法,即使要求“最好”也会增加你获得你的问题已结束。)

于 2012-09-21T19:19:42.480 回答