5

我想在 R 中的二进制矩阵上应用 byclustering。有一个名为“biclust”的不错的包可用,但它不会显示我想要的所有内容。

我有一个二进制矩阵,如下所示:

1 0 0 1 0 1 0
0 0 0 0 0 0 0
0 0 1 0 1 0 0
1 0 0 1 0 1 0
0 0 1 0 1 0 0
1 0 0 1 0 1 0
0 0 0 0 0 0 0

我的目标是将其分类(并显示)如下(可能是彩色的):

1 1 1 0 0 0 0
1 1 1 0 0 0 0
1 1 1 0 0 0 0
0 0 0 1 1 0 0
0 0 0 1 1 0 0
0 0 0 0 0 0 0
0 0 0 0 0 0 0

设置代码:

# install.packages("biclust") (if necessary)
library("biclust")

testMatrix <- matrix(c(1,0,0,1,0,1,0,
                       0,0,0,0,0,0,0,
                       0,0,1,0,1,0,0,
                       1,0,0,1,0,1,0,
                       0,0,1,0,1,0,0,
                       1,0,0,1,0,1,0,
                       0,0,0,0,0,0,0),
                     nrow = 7,
                     ncol = 7,
                     byrow = TRUE)

我应用了“biclust”R 包的 biclust 函数:

testCluster <- biclust(x = testMatrix, method=BCBimax())

事实上,我得到了预期的两个集群:

An object of class Biclust 
call:
biclust(x = testMatrix, method = BCBimax())
Number of Clusters found:  2 
First  2  Cluster sizes:
                      BC 1  BC 2
Number of Rows:       3     2
Number of Columns:    3     2

我可以通过以下方式分别显示集群:

drawHeatmap(x = testMatrix, bicResult = testCluster, number = 1) # shown in picture below
drawHeatmap(x = testMatrix, bicResult = testCluster, number = 2)

图片

我可以通过以下方式显示整个聚类矩阵(左上角的一个聚类):

drawHeatmap2(x = testMatrix, bicResult = testCluster, number = 1) # shown in picture below
drawHeatmap2(x = testMatrix, bicResult = testCluster, number = 2)

图片

到目前为止一切顺利,但我想要:

  1. 显示颜色切换。现在 1 是红色,0 是绿色。
  2. 我想查看原始矩阵的行和列。现在只显示特定集群的行号和列号(使用 drawHeatMap),并且在整个集群矩阵(drawHeatMap2)中没有显示行号和列号。
  3. 我想要一个有序的聚集矩阵。现在只有在 drawHeatmap2 中指定的簇显示在左上角,但是对于矩阵的其余部分,我还希望其他簇从左上角到矩阵的其余部分的右下角很好地排序。

这些更改是否可能(使用“biclust”包)?还是用 R 以另一种方式做更好?

4

1 回答 1

3

更改 biclust 源码包中的 drawHeatmap() 函数:

  1. 跟踪(“drawHeatmap”,编辑=真)
  2. 更改以下内容:
    (a) 切换红色和绿色 - 在调用 rgb() 中切换 rvect 和 gvect
    (b) 原始行名而不是​​新行名 - 将 'labels=' 更改为 '=bicCols' 和 '=bicRows'。
  3. 打印行号:关于行的轴之前:cat(bicRows)。
  4. 将行号保存到文件 - 在关于行的轴之前:write(bicRows, file="FILENAME.txt")
于 2018-01-09T09:43:30.153 回答