我scatter_matrix
对pandas.plotting
模块中的工作方式有点困惑。例如,请参阅此处的情节https://www.geeksforgeeks.org/pair-plots-using-scatter-matrix-in-pandas/
沿主对角线的 3 个图看起来像分布。但是 y 和 x 轴标签表明它正在绘制一个变量与自身的关系,所以它不应该是一条直线吗?分布从何而来?
我scatter_matrix
对pandas.plotting
模块中的工作方式有点困惑。例如,请参阅此处的情节https://www.geeksforgeeks.org/pair-plots-using-scatter-matrix-in-pandas/
沿主对角线的 3 个图看起来像分布。但是 y 和 x 轴标签表明它正在绘制一个变量与自身的关系,所以它不应该是一条直线吗?分布从何而来?
默认情况下pandas.plotting.scatter_matrix
,在对角线上绘制直方图。每个直方图仅显示该数据列的计数。否则,正如您所提到的,我们在对角线上只有(无用的)直线。
有一个diagonal
参数可以在直方图或内核密度之间进行选择:
pandas.plotting.scatter_matrix(frame, alpha=0.5, figsize=None, ax=None, grid=False, diagonal='hist', marker='.', density_kwds=None, hist_kwds=None, range_padding=0.05, **kwargs)
...
diagonal{'hist', 'kde'}
:在“kde”和“hist”之间选择核密度估计或对角线中的直方图。