0

我有以下方式的数据矩阵:

ID_REF GSM362180    GSM362181  GSM362188    GSM362189  GSM362192
244901 5.094871713 4.626623079 4.554272515 4.748604391 4.759221647
244902 5.194528083 4.985930299 4.817426064 5.151654407 4.838741605
244903 5.412329253 5.352970877 5.06250609  5.305709079 8.365082403
244904 5.529220594 5.28134657  5.467445095 5.62968933  5.458388909
244905 5.024052699 4.714631878 4.792865831 4.843975286 4.657188246
244906 5.786557533 5.242403911 5.060605782 5.458148567 5.890061836

我想按列对它进行聚类以找出相似的启动子(列代表启动子,行代表基因)。我之前使用 pv clust 来完成它,但希望有更详细的聚类(可能是分层类型?)。我想知道这些列聚集在一起的距离。我总共有 20 列和 22810 个基因。

4

1 回答 1

1

谷歌搜索R clustering会产生许多有趣的结果。一个选项可能是hclust. 这个链接也可能很有趣。

于 2012-11-01T11:01:05.160 回答