问题标签 [pandas-profiling]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
599 浏览

linux - 在 Ubuntu 20.04 上使用 Pip 安装 pandas_profiling 时出错

pip install pandas_profiling

失败于

为瓶颈运行 setup.py install ... 错误错误:命令错误,退出状态为 1:命令:/home/me/venv/bin/python -u -c 'import io, os, sys, setuptools, tokenize; sys.argv[0] = '"'"'/tmp/pip-install-u7f_8_0k/bottleneck_1375337c49c246109b2e650965628211/setup.py'"'"'; file ='"'"'/tmp/pip-install-u7f_8_0k/bottleneck_1375337c49c246109b2e650965628211/setup.py'"'"';f = getattr(tokenize, '"'"'open'"'"', open)( file ) if os.path.exists( file ) else io.StringIO('"'"'from setuptools import setup; setup()'"'"');code = f.read().replace('"'"'\ r\n'"'"', '9/瓶颈/src x86_64-linux-gnu-gcc -pthread -Wno-unused-result -Wsign-compare -DNDEBUG -g -fwrapv -O2 -Wall -g -fstack-protector-strong -Wformat -Werror=format-security -g -fwrapv -O2 -g -fstack-protector-strong -Wformat -Werror=format-security -Wdate-time -D_FORTIFY_SOURCE=2 -fPIC -I/home/me/venv/lib/python3.9/site-packages /numpy/core/include -I/home/me/venv/include -I/usr/include/python3.9 -cbottleneck/src/reduce.c -o build/temp.linux-x86_64-3.9/bottleneck/src /reduce.o -O2 在瓶颈/src/reduce.c:1 中包含的文件中:bottleneck/src/bottleneck.h:4:10:致命错误:Python.h:没有这样的文件或目录 4 | #include <Python.h> | ^~~~~~~~~~ 编译终止。错误:命令 '/usr/bin/x86_64-linux-gnu-gcc' 失败,退出代码 1 ---------------------------- ------------ 错误:命令出错,退出状态为 1:/home/me/venv/bin/python -u -c '导入 io、os、sys、setuptools、tokenize;sys.argv[0] = '"'"'/tmp/pip-install-u7f_8_0k/bottleneck_1375337c49c246109b2e650965628211/setup.py'"'"';file ='"'"'/tmp/pip-install-u7f_8_0k/bottleneck_1375337c49c246109b2e650965628211/setup.py'"'"';f = getattr(tokenize, '"'"'open'"'"', open)( file ) if os.path.exists( file ) else io.StringIO('"'"'from setuptools import setup; setup()'"'"');code = f.read().replace('"'"'\ r\n'"'"', '"'"'\n'"'"');f.close();exec(compile(code, file , '"'"'exec'"'"')) ' 安装 --record /tmp/pip-record-pgrmqqqd/install-record.txt --single-version-externally-managed --compile --install-headers /home/me/venv/include/site/python3.9/瓶颈 检查日志以获取完整的命令输出。

我在 Ubuntu 20.04 上,我的 python 版本是-

Python 3.9.0+

我尝试单独安装瓶颈,

pip install 瓶颈 --no-cache-dir

但这也给出了同样的错误。已查看相关主题的解决方案,

致命错误:Python.h:没有这样的文件或目录

安装脚本退出并出现错误:命令“x86_64-linux-gnu-gcc”失败,退出状态为 1

瓶颈错误的造轮失败

但没有运气。任何帮助,将不胜感激。

0 投票
1 回答
75 浏览

python - 是否可以从 Pandas Profiling 中获得详细的词频列表?

我目前正在处理大量文件,这些文件需要我检查某些字符串的频率。我的第一个想法是将所有文件导入单个数据集,并使用 for 循环使用以下代码检查所有文件中的字符串。

这最终失败了,因为绝对零保证这些文件中的字符串将被正确拼写,因为有问题的文件是由 OCR 程序生成的(并且有问题的文件是泰语)。

Pandas Profiling 准确地生成了我手头工作所需的内容,但它没有提供完整列表,如此链接 ( https://imgur.com/xxf1Qnx ) 中所示。有没有办法从 Pandas Profiling 中获取完整的词频列表?我试过检查 pandas_profiling 文档(https://pandas-profiling.github.io/pandas-profiling/docs/master/index.html),看看是否有什么我可以做的,到目前为止我还没有看到任何相关的到我这里的用例。

0 投票
0 回答
39 浏览

pandas-profiling - pandas-profiling 如何确定使用哪种关联方法在报告中生成关联警告?你能显示相关的方法吗?

pandas-profiling 如何确定使用哪种关联方法在报告中生成关联警告?

查看文档时,默认情况下我可以看到...

...并且我假设Pearson 和 Cramer 的 V 分别用于数值和分类类型。

是这样吗?如何pandas-profiling做到这一点(例如,如果所有correlations.XXXXXX.warn_high_correlations设置为 True 会发生什么)?有没有办法在报告中查看哪个相关性计算产生了“高相关性”警告?

0 投票
0 回答
371 浏览

widget - Pandas-Profiling.to_widgets():显示小部件时出错:找不到模型

错误截图

我一直面临一个间歇性问题,即熊猫分析小部件未呈现并且它已经持续了一段时间。

我在命令提示符下试过这个:

它出现“ - Validating:ok”但仍然没有呈现。

一个快速的谷歌搜索让我找到了一些 githubs/pandas-profiling/issues 部分,但它们已经有几年历史了。

0 投票
1 回答
189 浏览

styles - pandas-profiling 显示样式不在库中的错误,我该如何添加样式?

从 pandas_profiling 导入 ProfileReport 作为 pr

个人资料 = pr(csv_data)

轮廓

错误:在样式库中找不到“C:\Users\admin\anaconda3\envs\dataPipe\lib\site-packages\pandas_profiling\pandas_profiling.mplstyle”,并且输入不是有效的 URL 或路径;查看style.available可用样式列表

我尝试使用 .zip 或不同版本(例如 2.6.0、2.7.1)卸载并重新安装 pandas-profiling,但没有任何修复。当前版本是默认的 3.0.0。

0 投票
2 回答
305 浏览

pandas - 大熊猫分析中的高相关性是什么意思?

我正在尝试pandas profiling在泰坦尼克号日期集上使用。在概述部分下有一些带有标题“ HIGH CORRELATION”的功能

  • 我知道相关性的含义是什么,但标题并没有说明哪个特征与该特征相关?
  • 那么HIGH CORRELATION熊猫分析文档中的“”是什么意思?
0 投票
0 回答
66 浏览

python - 如何按组生成 Pandas 分析报告

在 pandas-profiling 中是否有任何参数可以定义,允许报告由特定组变量的组给出?

如果显示每个变量图都可以区分组,那就太棒了。

0 投票
0 回答
53 浏览

pandas - 熊猫分析相关警告似乎是错误的

我正在处理这个日期集:

我正在查看的结果,pandas profiling它表明该age列具有HIGH CORRELATIONthalach列。

我检查了这些字段之间的 3 种相关性:

我得到:

3 种相关性显示出较低的相关性。

我错过了什么?有没有办法熊猫分析是错误的?

0 投票
1 回答
145 浏览

python - 在 Pandas 分析报告中显示“其他值”

我正在创建一个 Pandas 分析报告。在“变量”下显示每列的详细信息。当我按下“切换详细信息”并导航到“类别”时,最常见的值以“其他值”结尾,在我的数据集中约占 50%。是否有可能打印该报告中的所有值,因此不合并其他值?

0 投票
1 回答
217 浏览

python - 无法导入“pandas_profiling”模块

conda install -c conda-forge pandas-profiling我已经在基础环境中安装了“pandas_profiling” 。我可以看到conda listpandas_profiling 已正确安装(附快照), 在此处输入图像描述

当我尝试import pandas_profiling收到 ModuleNotFoundError

更新:输出import sys; print(sys.path); print(sys.prefix)