我有以下方式的数据矩阵:
ID_REF GSM362180 GSM362181 GSM362188 GSM362189 GSM362192
244901 5.094871713 4.626623079 4.554272515 4.748604391 4.759221647
244902 5.194528083 4.985930299 4.817426064 5.151654407 4.838741605
244903 5.412329253 5.352970877 5.06250609 5.305709079 8.365082403
244904 5.529220594 5.28134657 5.467445095 5.62968933 5.458388909
244905 5.024052699 4.714631878 4.792865831 4.843975286 4.657188246
244906 5.786557533 5.242403911 5.060605782 5.458148567 5.890061836
我想按列对它进行聚类以找出相似的启动子(列代表启动子,行代表基因)。我之前使用 pv clust 来完成它,但希望有更详细的聚类(可能是分层类型?)。我想知道这些列聚集在一起的距离。我总共有 20 列和 22810 个基因。