问题标签 [pandas-profiling]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
485 浏览

pandas-profiling - 不要在熊猫分析中使用索引

在数据帧上运行 pandas-profiling 时,我看到它将索引分析为变量。注意:我的索引是唯一键(命名为 UUID)

有没有办法排除引入索引来报告?

我知道我可以在 pandas 中删除它,但在我的脑海中我想做

ProfileReport(df, use_index=False)

0 投票
0 回答
233 浏览

python - 如何从 pandas_profiling 运行配置文件报告?

我使用下面的代码导入了 pandas、numpy 和 pandas 分析,但由于某种原因,它不会显示任何数据,只显示 3 行信息,所以这里是代码:

...这是输出:

请问有人知道为什么它不起作用吗?

0 投票
0 回答
84 浏览

python - Pandas 分析中的列类型问题

我在包含 140 列的数据集中使用 pandas-profiling。

这是我的代码:

但我收到此错误:

我该如何解决?

谢谢

0 投票
1 回答
737 浏览

python - 使用 pandas-profiling 时如何更改变量类型?

为了重现问题,笔记本,数据,输出:github链接
我的数据集中有合同变量/列,看起来像这样,看起来都像数字,但它们实际上是分类的。
在此处输入图像描述

当使用 pandas 读取时,信息显示它被读取为 int。由于合同变量是一个类别(来自我收到的元数据)所以我手动更改了变量类型,如下所示

然后我试图从pandas_profiling. 生成的报告显示它contact被解释为实数,即使我将类型从更改intstr/ category

在此处输入图像描述

你能解释解释数据类型的正确方法pandas_profiling吗?即,将contract变量更改为categorical类型。

0 投票
1 回答
724 浏览

matplotlib - 无法在 Databricks 上运行 Pandas 分析

我正在尝试在 Databricks 环境中的示例数据帧上运行 Pandas 分析。收到与 marplotlib 相关的错误,不确定此问题是否与 Matplotlib 或 pandas-profiling 有关。任何帮助将不胜感激。

Databricks 运行时配置: 7.4 ML(包括 Apache Spark 3.0.1、Scala 2.12)

像这样安装 !pip install pandas-profiling[notebook]

代码

错误日志跟踪

0 投票
0 回答
84 浏览

python - 可以修改 Pandas Profiling 中的 Overview 选项卡

我希望删除熊猫分析 HTML 报告中“概述”选项卡下的“警告”和“复制”菜单选项/选项卡。

示例配置文件图像

我们希望将其集成到我们的应用程序中,以显示对数据集的基本了解。我们希望删除我们要求的警告。

0 投票
0 回答
247 浏览

python - Flask Web App 将 Pandas 分析输出到 Web 浏览器中的新 HTML 页面

我有一个 python Flask web 应用程序,它使用 plotly 的 dash 应用程序上传 CSV/txt 文件以使用 Pandas Profiling 进行处理。在我的本地服务器上一切正常,但是一旦我将它发布到 Azure Web 应用程序,它就不再生成带有 Pandas 分析结果的新 HTML 文件。在本地完成时,HTML 确实有我的本地驱动器地址位置到 HTML 文件,但不确定如何为在线 Web 应用程序解决此问题。

请在下面查看我的代码。不确定我需要什么才能让 Web 应用程序生成带有结果的新 HTML 页面。

0 投票
1 回答
265 浏览

python - 自定义 pandas-profiling 中的图(更改相关热图中的颜色/颜色条/..)

我搜索了 pandas 分析文档及其高级使用网页,但我找不到如何自定义它生成的图。例如。现在它显示了相关矩阵,颜色条的蓝色为 1,红色为 -1。如果我想反转颜色怎么办?或者完全改变调色板?高级选项允许跳过某些部分或更改计算相关性的默认值,但是否可以将参数传递给底层 matplotlib?我的猜测是,是相关图的原因,但是 a)我不知道如何将任何东西传递给它;b)其他情节(例如相互作用)呢?

例子

0 投票
0 回答
135 浏览

python - 如何制作包含熊猫分析的可执行文件?

根据这张票https://github.com/pandas-profiling/pandas-profiling/issues/706(建议在stackoverflow上询问),有没有办法(可能是修改后的规范文件)从pyinstaller获得一个简单的可执行文件使用熊猫分析?作为参考,我当前实现此目的的 python 代码如下所示

在阅读了关于 pandas-profiling 中使用的多处理可能会导致 pyinstaller 出现问题的建议后,添加了 freeze_support。运行可执行文件时出现的错误是“没有这样的文件或目录”,更具体地说,是 pandas-profiling 缺少 config-default.yaml 文件。我将 pandas-profiling 添加到我的 spec 文件的隐藏导入中,这并没有改变任何东西。

有没有人知道怎么做,也许如何修改 pyinstaller 的规范文件?

0 投票
0 回答
155 浏览

python - 从 AWS EMR Jupyter Notebook 生成 HTML 输出

我目前正在 EMR 上运行默认/基本笔记本(发布标签:emr-6.1.0,应用程序:Spark 3.0.0,Zeppelin 0.9.0,JupyterHub 1.1.0),我在让笔记本电脑运行时遇到了一些问题以 HTML 格式输出数据分析报告。

我已经安装了pandas-profiling多种方式,使用自定义引导操作和命令sc.install_pypi_package("pandas-profiling")

在尝试使用 IPython 生成报告的 HTML 后,我遇到了以下问题。它只生成对象与 HTML。

在此处输入图像描述

我也知道添加%%local可以帮助产生它,如下所示。

在此处输入图像描述

但是通过引导操作/在笔记本上安装不会从任何%%local位置安装。如下所示。

在此处输入图像描述

所以我的第一个问题是,这份档案报告可以在没有%%local魔法的情况下制作吗?我知道还有一个%%html魔术命令,但是它不能根据我的测试打印出一个变量,因此我需要 IPython。

第二个问题是,如何才能pandas-profiling添加到这个%%local环境中?这甚至应该是方法吗?

谢谢!!