问题标签 [eda]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
27 浏览

seaborn - 由于该方法不带参数,如何更改热图的标题?

我绘制了一个图表并想更改标题,但我没有看到任何参数:

代码:

在此处输入图像描述

我需要更改固定在“特征相关性(皮尔森)”的标题

0 投票
2 回答
31 浏览

python - 我只想那些值计数> 15但它为所有名称给出真假的名字

我得到这个输出

当我使用此代码时,我得到:

但我只想要计数 > 15 的名称。请帮助我提出条件。PS新在这里

0 投票
2 回答
27 浏览

python - 如何在图表中分隔条形并扩展 X-labels 以使其更整洁?我试过 set_xticklabels 但无济于事

这是我使用的代码。

请让我知道如何增加图表的大小并将条形隔开以进行更整洁的演示。我使用的代码已正式上传。

0 投票
1 回答
12 浏览

python - PyCaret 新功能 EDA 未能上线

我今天刚刚在运行 Monterey 12.1 的 Mac 上安装了 PyCaret 2.3.6。在 Google CoLab 上安装很顺利,我使用了 heart_disease 数据集和通常的初始设置说明。在我尝试 eda() 之前,一切都运行良好。最初,我看到了几个图,但注意到我无法更改 Y 轴变量。当我再次运行所有内核时,eda 无法启动并给出以下错误消息

对数据集中的变量进行分类... 13 个分类的预测变量... 没有删除变量,因为在数据集中没有发现 ID 或低信息变量

################ Binary_Classification VISUALIZATION Started #####################

IndexError Traceback(最近一次调用最后一次)/tmp/ipykernel_353/3763129898.py in ----> 1 eda()

draw_cat_vars_hv 中的 4 帧 /usr/local/lib/python3.7/dist-packages/autoviz/AutoViz_Holo.py(dfin,dep,nums,cats,chart_format,problem_type,mk_dir,verbose)240 241 x = pnw.Select(名称='X-Axis', value=quantileable[0], options=cats) --> 242 y = pnw.Select(name='Y-Axis', value=quantileable[1], options=quantileable) 243 244 # # 你需要用depends装饰这个函数以使小部件实时改变轴##

IndexError:列表索引超出范围

0 投票
1 回答
27 浏览

python - 如何从python中的XML中类似类型的标签中获取特定的标签文本?

我有以下标签 -

我尝试了,但是为每个 preamHD 标签获取了 P 标签的所有文本-

我怎样才能只获得申请日期 P 标签文本?任何帮助,将不胜感激。

0 投票
1 回答
26 浏览

events - KubeMQ 忽略流中的 Acks / Acknowledgements

此功能:

https://kafka.apache.org/10/documentation/streams/developer-guide/config-streams.html#acks

KubeMQ 流似乎缺少。我们是遗漏了什么还是他们只是忽略了它?这将从根本上改变我们在选择事件驱动模型时的架构决策。或者,也许我们错过了一种使用事件和 KubeMQ 持久性来保证一次交付的新方式/术语?

提前致谢,

0 投票
2 回答
30 浏览

python - Python中多列数据框的EDA for循环

只是一个随机的q。如果有一个来自 Boston Homes ds 的数据框 df,并且我正在尝试对一些列进行 EDA,并设置为变量 feature_cols,之后我可以使用它来检查 na,如何处理? 我有以下内容,这会引发错误: 在此处输入图像描述

这是我希望在上述之后尝试做的事情: 在此处输入图像描述

任何反馈将不胜感激。提前致谢。

0 投票
2 回答
34 浏览

python - 请问各位大佬收到这个错误的原因是什么

TypeError:无法使用 dtyped [bool] 数组和 [NoneType] 类型的标量执行“ror_”

###每当我运行此代码时都会收到此错误。

打印(df < (Q1 - 1.5 * IQR)) |(df > (Q3 + 1.5 * IQR))

请问我做错了什么?

0 投票
0 回答
13 浏览

data-analysis - 当分布呈指数分布时,如何确定切割线?

我目前从事电子商务客户数据分析。

我绘制了客户点击分布并得到了下图。

X = 点击次数 / Y = 客户数量

对我来说,这似乎是指数分布..(不完全是,但类似)

我想使用具有一定点击量的客户数据进行分析,但我不知道如何获得正确的切割线。

我如何确定它到底是哪种分布,以及在哪里切断?

请帮我..

0 投票
1 回答
20 浏览

python - 从事数据探索工作,我现在处于清理数据级别

我想知道当我的数据集中有日期并且日期列中有 NULL 值时,在 datetime dtype 中估算日期 Null 值的最佳方法是什么?!

至于浮点值,我已经用平均值估算了它们,但我一直在处理日期。任何建议,请!谢谢