0

我正在尝试pandas profiling在泰坦尼克号日期集上使用。在概述部分下有一些带有标题“ HIGH CORRELATION”的功能

  • 我知道相关性的含义是什么,但标题并没有说明哪个特征与该特征相关?
  • 那么HIGH CORRELATION熊猫分析文档中的“”是什么意思?
4

2 回答 2

1

如果您单击Warnings选项卡,它将显示这些特征与其他哪些特征相关,如本例所示在示例中可以看到与实际泰坦尼克号数据相同的内容。

于 2021-06-06T04:25:16.797 回答
0

您还可以设置阈值来确定要考虑的内容HIGH CORRELATION。例如(使用当前最新版本3.1.0pandas_profiling),

profile = ProfileReport(df, 
                        missing_diagrams=None, 
                        interactions=None,
                        correlations={"pearson": {"calculate": True, "threshold": 0.8},
                                      "spearman": {"calculate": False},
                                      "kendall": {"calculate": False},
                                      "phi_k": {"calculate": False},
                                      "cramers": {"calculate": False}},
                        explorative=True)
profile
于 2021-10-15T07:39:14.230 回答