基本上我想知道我是否可以生成一个热图,其中色阶基于每列中的值范围。该解决方案不一定要进行任何聚类或生成树状图。
我有一个包含一系列不同类型变量的数据框。有些是连续的,而另一些是虚拟变量或序数。我知道我需要将数据作为数字传递给任何聚类函数,并且 daisy() 函数是此处聚类的最佳选择。
我想生成一个热图,就像使用 heatmap 和 heatmap.2 生成的一样,但是缩放会导致可视化出现问题。这个问题帮助我弄清楚如何让 daisy() 与 heatmap.2 一起工作,但按列缩放意味着分配给虚拟变量的颜色因列而异。例如,对于具有虚拟变量的所有列,而不是 red=1 和 white=0,阴影非常归因于不同的平均值和标准偏差。或者,如果我关闭缩放,整个数据集的阴影几乎没有变化。似乎颜色的范围是基于整个数据框的范围,而不是每一列。
当我有时间时,我会尝试添加一些示例。
编辑
好的,这显然不清楚。
我遇到的热图示例根据整个数据帧的最小值和最大值来缩放颜色。因此,给定这样的数据框:
Row Var 1 Var2
1 1 1
2 -5 10
3 0 7
我将蓝色设置为最低单元格,白色表示中间值,红色表示最高单元格。结果将如下所示:
Row Var 1 Var2
1 White White
2 Blue Red
3 Blue Red
相反,我希望比例取决于每列中的值,结果如下所示:
Row Var 1 Var2
1 White Blue
2 Blue Red
3 Red White