问题标签 [pandas-profiling]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
pandas-profiling - 不要在熊猫分析中使用索引
在数据帧上运行 pandas-profiling 时,我看到它将索引分析为变量。注意:我的索引是唯一键(命名为 UUID)
有没有办法排除引入索引来报告?
我知道我可以在 pandas 中删除它,但在我的脑海中我想做
ProfileReport(df, use_index=False)
python - 如何从 pandas_profiling 运行配置文件报告?
我使用下面的代码导入了 pandas、numpy 和 pandas 分析,但由于某种原因,它不会显示任何数据,只显示 3 行信息,所以这里是代码:
...这是输出:
请问有人知道为什么它不起作用吗?
python - Pandas 分析中的列类型问题
我在包含 140 列的数据集中使用 pandas-profiling。
这是我的代码:
但我收到此错误:
我该如何解决?
谢谢
python - 使用 pandas-profiling 时如何更改变量类型?
为了重现问题,笔记本,数据,输出:github链接
我的数据集中有合同变量/列,看起来像这样,看起来都像数字,但它们实际上是分类的。
当使用 pandas 读取时,信息显示它被读取为 int。由于合同变量是一个类别(来自我收到的元数据)所以我手动更改了变量类型,如下所示
然后我试图从pandas_profiling
. 生成的报告显示它contact
被解释为实数,即使我将类型从更改int
为str
/ category
。
你能解释解释数据类型的正确方法pandas_profiling
吗?即,将contract
变量更改为categorical
类型。
matplotlib - 无法在 Databricks 上运行 Pandas 分析
我正在尝试在 Databricks 环境中的示例数据帧上运行 Pandas 分析。收到与 marplotlib 相关的错误,不确定此问题是否与 Matplotlib 或 pandas-profiling 有关。任何帮助将不胜感激。
Databricks 运行时配置: 7.4 ML(包括 Apache Spark 3.0.1、Scala 2.12)
像这样安装
!pip install pandas-profiling[notebook]
代码
错误日志跟踪
python - 可以修改 Pandas Profiling 中的 Overview 选项卡
我希望删除熊猫分析 HTML 报告中“概述”选项卡下的“警告”和“复制”菜单选项/选项卡。
我们希望将其集成到我们的应用程序中,以显示对数据集的基本了解。我们希望删除我们要求的警告。
python - Flask Web App 将 Pandas 分析输出到 Web 浏览器中的新 HTML 页面
我有一个 python Flask web 应用程序,它使用 plotly 的 dash 应用程序上传 CSV/txt 文件以使用 Pandas Profiling 进行处理。在我的本地服务器上一切正常,但是一旦我将它发布到 Azure Web 应用程序,它就不再生成带有 Pandas 分析结果的新 HTML 文件。在本地完成时,HTML 确实有我的本地驱动器地址位置到 HTML 文件,但不确定如何为在线 Web 应用程序解决此问题。
请在下面查看我的代码。不确定我需要什么才能让 Web 应用程序生成带有结果的新 HTML 页面。
python - 如何制作包含熊猫分析的可执行文件?
根据这张票https://github.com/pandas-profiling/pandas-profiling/issues/706(建议在stackoverflow上询问),有没有办法(可能是修改后的规范文件)从pyinstaller获得一个简单的可执行文件使用熊猫分析?作为参考,我当前实现此目的的 python 代码如下所示
在阅读了关于 pandas-profiling 中使用的多处理可能会导致 pyinstaller 出现问题的建议后,添加了 freeze_support。运行可执行文件时出现的错误是“没有这样的文件或目录”,更具体地说,是 pandas-profiling 缺少 config-default.yaml 文件。我将 pandas-profiling 添加到我的 spec 文件的隐藏导入中,这并没有改变任何东西。
有没有人知道怎么做,也许如何修改 pyinstaller 的规范文件?
python - 从 AWS EMR Jupyter Notebook 生成 HTML 输出
我目前正在 EMR 上运行默认/基本笔记本(发布标签:emr-6.1.0,应用程序:Spark 3.0.0,Zeppelin 0.9.0,JupyterHub 1.1.0),我在让笔记本电脑运行时遇到了一些问题以 HTML 格式输出数据分析报告。
我已经安装了pandas-profiling多种方式,使用自定义引导操作和命令sc.install_pypi_package("pandas-profiling")
在尝试使用 IPython 生成报告的 HTML 后,我遇到了以下问题。它只生成对象与 HTML。
我也知道添加%%local
可以帮助产生它,如下所示。
但是通过引导操作/在笔记本上安装不会从任何%%local
位置安装。如下所示。
所以我的第一个问题是,这份档案报告可以在没有%%local
魔法的情况下制作吗?我知道还有一个%%html
魔术命令,但是它不能根据我的测试打印出一个变量,因此我需要 IPython。
第二个问题是,如何才能pandas-profiling
添加到这个%%local
环境中?这甚至应该是方法吗?
谢谢!!