1

scatter_matrixpandas.plotting模块中的工作方式有点困惑。例如,请参阅此处的情节https://www.geeksforgeeks.org/pair-plots-using-scatter-matrix-in-pandas/

沿主对角线的 3 个图看起来像分布。但是 y 和 x 轴标签表明它正在绘制一个变量与自身的关系,所以它不应该是一条直线吗?分布从何而来?

4

1 回答 1

1

默认情况下pandas.plotting.scatter_matrix,在对角线上绘制直方图。每个直方图仅显示该数据列的计数。否则,正如您所提到的,我们在对角线上只有(无用的)直线。

有一个diagonal参数可以在直方图或内核密度之间进行选择:

pandas.plotting.scatter_matrix(frame, alpha=0.5, figsize=None, ax=None, grid=False, diagonal='hist', marker='.', density_kwds=None, hist_kwds=None, range_padding=0.05, **kwargs)

...

diagonal{'hist', 'kde'}:在“kde”和“hist”之间选择核密度估计或对角线中的直方图。

于 2021-03-22T17:01:54.980 回答