我正在处理一个数据集(第 1 列 = 基因名称和第 2 列 = 表达值),我正在尝试做一个聚类图,但我发现分支是用行号而不是列中的基因 ID 标记的1.
数据集:https ://dl.dropbox.com/u/364456/miRNA.csv
使用:
attach(animals)
d=dist(as.matrix(animals))
hc=hclust(d)
plot(hc)
结果图:
我尝试进行 kmeans 聚类并最终收到此错误:
通过强制引入的 NA。
这表明我没有正确格式化我的数据文件。
有人知道这里发生了什么吗?