问题标签 [pandas-profiling]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
linux - 在 Ubuntu 20.04 上使用 Pip 安装 pandas_profiling 时出错
pip install pandas_profiling
失败于
为瓶颈运行 setup.py install ... 错误错误:命令错误,退出状态为 1:命令:/home/me/venv/bin/python -u -c 'import io, os, sys, setuptools, tokenize; sys.argv[0] = '"'"'/tmp/pip-install-u7f_8_0k/bottleneck_1375337c49c246109b2e650965628211/setup.py'"'"'; file ='"'"'/tmp/pip-install-u7f_8_0k/bottleneck_1375337c49c246109b2e650965628211/setup.py'"'"';f = getattr(tokenize, '"'"'open'"'"', open)( file ) if os.path.exists( file ) else io.StringIO('"'"'from setuptools import setup; setup()'"'"');code = f.read().replace('"'"'\ r\n'"'"', '9/瓶颈/src x86_64-linux-gnu-gcc -pthread -Wno-unused-result -Wsign-compare -DNDEBUG -g -fwrapv -O2 -Wall -g -fstack-protector-strong -Wformat -Werror=format-security -g -fwrapv -O2 -g -fstack-protector-strong -Wformat -Werror=format-security -Wdate-time -D_FORTIFY_SOURCE=2 -fPIC -I/home/me/venv/lib/python3.9/site-packages /numpy/core/include -I/home/me/venv/include -I/usr/include/python3.9 -cbottleneck/src/reduce.c -o build/temp.linux-x86_64-3.9/bottleneck/src /reduce.o -O2 在瓶颈/src/reduce.c:1 中包含的文件中:bottleneck/src/bottleneck.h:4:10:致命错误:Python.h:没有这样的文件或目录 4 | #include <Python.h> | ^~~~~~~~~~ 编译终止。错误:命令 '/usr/bin/x86_64-linux-gnu-gcc' 失败,退出代码 1 ---------------------------- ------------ 错误:命令出错,退出状态为 1:/home/me/venv/bin/python -u -c '导入 io、os、sys、setuptools、tokenize;sys.argv[0] = '"'"'/tmp/pip-install-u7f_8_0k/bottleneck_1375337c49c246109b2e650965628211/setup.py'"'"';file ='"'"'/tmp/pip-install-u7f_8_0k/bottleneck_1375337c49c246109b2e650965628211/setup.py'"'"';f = getattr(tokenize, '"'"'open'"'"', open)( file ) if os.path.exists( file ) else io.StringIO('"'"'from setuptools import setup; setup()'"'"');code = f.read().replace('"'"'\ r\n'"'"', '"'"'\n'"'"');f.close();exec(compile(code, file , '"'"'exec'"'"')) ' 安装 --record /tmp/pip-record-pgrmqqqd/install-record.txt --single-version-externally-managed --compile --install-headers /home/me/venv/include/site/python3.9/瓶颈 检查日志以获取完整的命令输出。
我在 Ubuntu 20.04 上,我的 python 版本是-
Python 3.9.0+
我尝试单独安装瓶颈,
pip install 瓶颈 --no-cache-dir
但这也给出了同样的错误。已查看相关主题的解决方案,
但没有运气。任何帮助,将不胜感激。
python - 是否可以从 Pandas Profiling 中获得详细的词频列表?
我目前正在处理大量文件,这些文件需要我检查某些字符串的频率。我的第一个想法是将所有文件导入单个数据集,并使用 for 循环使用以下代码检查所有文件中的字符串。
这最终失败了,因为绝对零保证这些文件中的字符串将被正确拼写,因为有问题的文件是由 OCR 程序生成的(并且有问题的文件是泰语)。
Pandas Profiling 准确地生成了我手头工作所需的内容,但它没有提供完整列表,如此链接 ( https://imgur.com/xxf1Qnx ) 中所示。有没有办法从 Pandas Profiling 中获取完整的词频列表?我试过检查 pandas_profiling 文档(https://pandas-profiling.github.io/pandas-profiling/docs/master/index.html),看看是否有什么我可以做的,到目前为止我还没有看到任何相关的到我这里的用例。
pandas-profiling - pandas-profiling 如何确定使用哪种关联方法在报告中生成关联警告?你能显示相关的方法吗?
pandas-profiling 如何确定使用哪种关联方法在报告中生成关联警告?
查看文档时,默认情况下我可以看到...
...并且我假设Pearson 和 Cramer 的 V 分别用于数值和分类类型。
是这样吗?如何pandas-profiling
做到这一点(例如,如果所有correlations.XXXXXX.warn_high_correlations
设置为 True 会发生什么)?有没有办法在报告中查看哪个相关性计算产生了“高相关性”警告?
styles - pandas-profiling 显示样式不在库中的错误,我该如何添加样式?
从 pandas_profiling 导入 ProfileReport 作为 pr
个人资料 = pr(csv_data)
轮廓
错误:在样式库中找不到“C:\Users\admin\anaconda3\envs\dataPipe\lib\site-packages\pandas_profiling\pandas_profiling.mplstyle”,并且输入不是有效的 URL 或路径;查看style.available
可用样式列表
我尝试使用 .zip 或不同版本(例如 2.6.0、2.7.1)卸载并重新安装 pandas-profiling,但没有任何修复。当前版本是默认的 3.0.0。
pandas - 大熊猫分析中的高相关性是什么意思?
我正在尝试pandas profiling
在泰坦尼克号日期集上使用。在概述部分下有一些带有标题“ HIGH CORRELATION
”的功能
- 我知道相关性的含义是什么,但标题并没有说明哪个特征与该特征相关?
- 那么
HIGH CORRELATION
熊猫分析文档中的“”是什么意思?
python - 如何按组生成 Pandas 分析报告
在 pandas-profiling 中是否有任何参数可以定义,允许报告由特定组变量的组给出?
如果显示每个变量图都可以区分组,那就太棒了。
pandas - 熊猫分析相关警告似乎是错误的
我正在处理这个日期集:
我正在查看的结果,pandas profiling
它表明该age
列具有HIGH CORRELATION
与thalach
列。
我检查了这些字段之间的 3 种相关性:
我得到:
3 种相关性显示出较低的相关性。
我错过了什么?有没有办法熊猫分析是错误的?
python - 在 Pandas 分析报告中显示“其他值”
我正在创建一个 Pandas 分析报告。在“变量”下显示每列的详细信息。当我按下“切换详细信息”并导航到“类别”时,最常见的值以“其他值”结尾,在我的数据集中约占 50%。是否有可能打印该报告中的所有值,因此不合并其他值?