问题标签 [pandas-profiling]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
248 浏览

pandas - changing pandas_profiling's report width size

How can I change pandas_profiling's report width size? now at jupyther lab/notebook other cells are fit to the monitor width but the pandas_profiling's report's width is narrow.

enter image description here

0 投票
1 回答
306 浏览

python - cx_Freeze 的熊猫分析问题

我正在使用cx_freeze将我的 Python 应用程序转换为 Windows 可执行文件。我pandas-profiling在我的一个脚本中使用包。当我运行我的 exe 文件时,我收到以下错误:

如果我将它pandas-profiling放在与 exe 文件相同的目录中然后运行它,我会收到以下错误:

在寻找多处理错误的解决方案时,我发现它pandas-profiling正在其中一个脚本中使用multiprocessing,并且需要multiprocessing.freeze_support()在该模块中调用,但我不知道在哪里添加它。

任何帮助,将不胜感激。

0 投票
1 回答
771 浏览

python - 如何使用 pandas_profiling 对表进行数据分析

当我尝试使用 pandas_profiling 对一个 sql server 表进行数据分析时,会抛出类似的错误

在当前进程完成其引导阶段之前,已尝试启动一个新进程。

这是我用来运行的代码,我不知道如何解决这个问题。

我希望看到给定表的分析结果:

在此处输入图像描述

0 投票
2 回答
1119 浏览

python-3.x - 为什么熊猫分析在 ipython 中没有显示任何输出?

我有一个关于“pandas_profiling”的快速问题。所以基本上我正在尝试使用熊猫“分析”,但它没有显示输出,而是这样说:

我在哪里犯错误??或者它与Ipython有什么关系?因为我在 Anaconda 中使用 Ipython。

0 投票
5 回答
11647 浏览

python - 如何使用 Pandas 分析来分析大型数据集?

数据不是很干净,但可以毫无问题地与 pandas 一起使用。pandas 库为 EDA 提供了许多非常有用的功能。

但是,当我对大数据(即 10 列的 1 亿条记录)使用分析时,从数据库表中读取它时,它没有完成,我的笔记本电脑内存不足,csv 中的数据大小约为 6 GB,我的 RAM 为 14 GB 我的空闲使用量约为 3 - 4 GB。

我也尝试过check_recoded = False选项。但它无助于完全分析。有没有办法分块和读取数据并最终生成一个整体的汇总报告?或任何其他将此函数用于大型数据集的方法。

0 投票
1 回答
362 浏览

python - 调用 pandas 分析后,Matplotlib pyplot 图看起来不同。我怎样才能解决这个问题?

我今天遇到了一个奇怪的问题。我偶然发现了一个名为 的包pandas_profiling,我认为它非常好。但是,在调用分析之后,我的 jupyter notebook 中的图发生了变化。轴刻度不再正确,整体外观不同。

你能帮我解决如何恢复通常的行为吗?

先感谢您,

尚特尔

我尝试重新加载 matplotlib.pyplot。

在此处输入图像描述

轮廓:

在此处输入图像描述

0 投票
1 回答
804 浏览

python - 如何将 pandas_profiling 与大型数据库表一起使用

我正在尝试使用 pandas_profiling 来分析表。它有大约 20 列,其中大部分是浮动的,并且有近 300 万条记录。

我收到以下错误:

Traceback(最近一次调用最后一次):文件“V:\Python\prof.py”,第 53 行,在 if name ==“ main ”:main() 文件“V:\Python\prof.py”,第 21 行,在主 df = pd.read_sql(query, sql_conn) 文件“C:\Users\linus\AppData\Local\Programs\Python\Python37\lib\site-packages\pandas\io\sql.py”,第 380 行,在read_sql chunksize=chunksize) 文件“C:\Users\linus\AppData\Local\Programs\Python\Python37\lib\site-packages\pandas\io\sql.py”,第 1477 行,在 read_query data = self._fetchall_as_list(光标)文件“C:\Users\linus\AppData\Local\Programs\Python\Python37\lib\site-packages\pandas\io\sql.py”,第 1486 行,_fetchall_as_ 列表结果 = cur.fetchall() MemoryError

我试过用更少的记录来工作。

有没有办法绕过这个错误?看起来这是一个内存限制。我们可以换一种方式吗?或者用 Python 是不可能的?

谢谢你的帮助

0 投票
1 回答
669 浏览

java - 从 Java 程序启动时,Pandas Profiling 不起作用

我有一个使用 pandas_profiling 的简单 Python 程序。这是源代码,我将其存储为 c:\temp\pandas_profiling_demo.py:

我还有一个启动 Python 程序的 Java 程序(这不是真正的程序,它涉及一个 GUI,但这会重现问题。)我的程序在 Eclipse 中,但我将在此处复制它:

当我运行 Java 程序时,它陷入了一个循环。这是重复输出的第一块:

当我在 Jupyter 笔记本中运行 Python 程序时,它工作正常,创建了所需的 html 文件。

当我注释掉这些行时,从 Java 调用时它可以正常工作(显示数据框):

由于如果不使用分析,我可以从 Java 运行程序,我怀疑 pandas_profiling 存在问题(或者至少对我来说存在问题。)为什么它会导致程序进入循环?

提前致谢。

0 投票
2 回答
1158 浏览

python - 如何在python中创建具有多个列表/数组的数据框

我有很多由一维数据组成的列表。如下所示:

现在,我必须创建如下数据框:

我需要这个数据框,以便我可以使用 pandas_profiling 来分析每一列。请建议。

我努力了

但它给出的数据如下:

也使用了 numpy hpstack,但不工作

0 投票
1 回答
1966 浏览

pandas - Pandas 分析报告中没有相关图

运行 Pandas 分析报告,即使存在具有强相关性的有效数值变量,也不会生成相关图。以下代码生成一个配置文件报告,其中 Correlation 部分为空白。