在我的应用程序中,我尽可能从 R 过渡到原生 Python(scipy + matplotlib),最大的任务之一是将 R 热图转换为 matplotlib 热图。这篇文章指导我进行移植。虽然大部分都没有痛苦,但我仍然不相信色彩图。
在展示代码之前,先解释一下:在 R 代码中,我定义了“breaks”,即从最低值到 10 的固定点数,理想情况下以数据的中值为中心。它的等价物是numpy.linspace
:
# Matrix is a DataFrame object from pandas
import numpy as np
data_min = min(matrix.min(skipna=True))
data_max = max(matrix.max(skipna=True))
median_value = np.median(matrix.median(skipna=True))
range_min = np.linspace(0, median_value, 50)
range_max = np.linspace(median_value, data_max, 50)
breaks = np.concatenate((range_min, range_max))
这给了我们 100 分用于着色。但是,我不确定如何在 Python 中做同样的事情。目前我有:
def red_black_green():
cdict = {
'red': ((0.0, 0.0, 0.0),
(0.5, 0.0, 0.0),
(1.0, 1.0, 1.0)),
'blue': ((0.0, 0.0, 0.0),
(1.0, 0.0, 0.0)),
'green': ((0.0, 0.0, 1.0),
(0.5, 0.0, 0.0),
(1.0, 0.0, 0.0))
}
my_cmap = mpl.colors.LinearSegmentedColormap(
'my_colormap', cdict, 100)
return my_cmap
再往下我做:
# Note: vmin and vmax are the maximum and the minimum of the data
# Adjust the max and min to scale these colors
if vmin > 0:
norm = mpl.colors.Normalize(vmin=0, vmax=vmax / 1.08)
else:
norm = mpl.colors.Normalize(vmin / 2, vmax / 2)
这些数字完全是经验性的,这就是为什么我想把它改成更强大的东西。如何根据中位数对颜色图进行归一化,或者我是否需要归一化?