问题标签 [pingouin]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
100 浏览

python - 从 pearson 相关数据中提取 r 值

我正在使用 pingouin stat 包来查找两组数据之间的相关性,然后我想检查这种相关性是否很强。但是,我得到 5-6 个输出值,其中只有一个是r. 如何r从输出数据中获取?

代码:

输出:

0 投票
1 回答
41 浏览

python - pg.pairwise_corr 错误:x 和 y 必须是一维数组

尝试使用 pg.pairwise_corr 方法出现以下错误:

pg.pairwise_corr(df)

我尝试使用该功能,只选择这样的一列

pg.pairwise_corr(df, columns='col')

并得到同样的错误。

事实上,我的数据框的所有列都具有相同的长度。(而且对于另一个数据框来说它工作得很好)。但是我使用 pd.concat 方法连接了一些文件,但是当对象最终是 data.frame 时,这应该无关紧要吗?

感谢您的建议!

0 投票
0 回答
28 浏览

python - 大型数据集上的 Pearsonr 和 pvalues,包括空值

我有约 375 个细胞系和约 14,000 个基因的数据文件。我正在尝试计算每个基因与其他所有基因的成对相关性。

代码非常简单,因为我使用的是 pingouin 包:

尝试运行此代码返回:

Pingouin 使用 Scipy pearsonr 进行计算,使用不带 Pingouin 的 pearsonr 返回相同的错误。

我还尝试使用虚拟数据集(随机数的 5x7 数据帧),它在不包含任何空值时工作正常,但如果数据帧中存在空值,则返回相同的错误。基于此,我认为我的数据集中的空值导致了问题 - 不幸的是,数据参差不齐,删除包含空值的所有行/列会使我没有留下任何行/列,并且在虚拟数据集中甚至一个 NaN值足以引发错误。由于 rcorr 在输入 pearsonr 之前删除了 NaN 值,我相信它会丢弃我所有的数据点并且没有任何东西可以输入。

df.corr 可以很好地计算我的 r 值,但我也需要一种方法来计算该数据集的 p 值,因为我们预计这些相关性中有很大一部分是微不足道的。

有没有一种方法可以在我的数据集中删除/屏蔽 NaN 值而不删除整个行/列?有没有办法运行 pearsonr,其行为类似于带有 (nan_policy:'omit') 的 spearmanr?我是否偏离了基地,这里的问题不是 NaN 值吗?

0 投票
0 回答
21 浏览

python - 皮尔逊相关的功效分析

Pingouin 提供了惊人的输出,其中也包括功率。

这是 github 页面:https ://github.com/raphaelvallat/pingouin/blob/master/notebooks/04_Correlations.ipynb

但我找不到他们如何在代码中计算功率。

最好的,

0 投票
0 回答
36 浏览

python - pingouin.rm_anova,重复测量方差分析错误。蟒蛇,熊猫

我想使用 pingouin rm_anova 重复测量 anova。我的数据是长格式的,有不同的时间点(时间),每个id是一个主题,每个主题在3个不同的时间点重复3次。DV 是 weight_loss,IVs 是组和时间。数据如下所示:

这是我的代码:

但我收到这样的错误消息:

我尝试了 'within' variable = ['time'] 并且它有效,但它不适用于单独的 ['group'] 变量或组合。我还检查了 NA,没有 NA 也没有 0。有谁知道出了什么问题以及如何解决?

先感谢您!

0 投票
1 回答
53 浏览

dataframe - DataFrame 到 DataFrameRow 的转换 (Julia)

Pingouin.jl用来测试正常性。

在他们的文档中,我们有

哪个应该返回DataFrame正常性true或数据集中false的每个name

目前,此广播已被弃用,我无法将每个唯一列输出(正在工作并输出一个 DataFrame)的结果连接到一个 DataFrame 中。

所以,到目前为止我所拥有的。

我得到的错误:

编辑push!在我的第一个版本的帖子中没有正确编写函数。但是,更改后错误仍然存​​在。如何将DataFramePingouin 的类型输出重新格式化为DataFrameRow

0 投票
0 回答
30 浏览

python - Python Pingouin 2 路不平衡方差分析

尝试使用 Pingouin 进行 2 路不平衡方差分析并获得 KeyError。这是我的一些代码,其中data_rostral是我的数据框,param是我之前定义的变量。

当我运行它时,它会给出如下所示的 KeyError -

其中totalcells是由 param 定义的列之一的标题。

我尝试重新运行它并设置dv=totalcells,以为我会一个一个地做一堆方差分析,而不是使用变量参数,但我得到了完全相同的错误。我在同一个 colab 笔记本中的混合 ANOVA 上使用变量 param 没有问题,所以我不认为是这样,除非 2 路不平衡的语法只是不同到足以使其无法工作。我查看了其他有类似问题的线程,但仍然无法弄清楚。

TIA。我是一个非常新手的编码器,感谢所有更正和建议!

0 投票
0 回答
23 浏览

python - Pingouin 混合方差分析未报告温室-盖瑟校正的 p 值

我正在使用 Pingouin 运行混合模型 anova,但我无法让它报告 Greenhouse-Geisser 校正的 p 值

我的数据结构如下:

用户身份 团体 test_id avg_payment 多变的 价值 健康)状况
21000010749909 控制 1 0 avg_daily_net_rev 0
21000021190553 控制 1 0-9 avg_daily_net_rev 80
21000021497845 控制 1 9-40 avg_daily_net_rev 48
21000020054046 测试 1 40-80 avg_daily_net_rev 14
21000021354449 控制 1 80-100 avg_daily_net_rev 7
21000010749909 控制 1 0 avg_daily_net_rev 0
21000021190553 控制 1 0-9 avg_daily_net_rev 76
21000021497845 控制 1 9-40 avg_daily_net_rev 30
21000020054046 测试 1 40-80 avg_daily_net_rev 48
21000021354449 控制 1 80-100 avg_daily_net_rev 71

我的代码是这样的

我究竟做错了什么?

谢谢

0 投票
0 回答
183 浏览

python - ImportError:无法使用 Pingouin 从 scipy.stats 导入模块

此问题出现在本地 Jupyter 笔记本中,我使用的是 Python 3.10

导入scipyscipy.stats没有问题。

但是,我正在尝试使用 Pingouin 库进行数据分析并遇到以下代码的问题:

由于 Pingouin 依赖于 SciPy,因此它会尝试导入所需的模块并至少卡在一个模块上。我已尝试卸载并重新安装 SciPy 和 Pingouin,但无法解决此问题。任何意见是极大的赞赏!

0 投票
0 回答
6 浏览

python - Cohen-d 与 pingouin 测试函数、配对样本有关的问题

我有两个时间值列表,“times0”和“times1”。
数据是配对的(times0 中的第一个值与 times1 中的第一个值配对,第二个值同上等)。我想要这些数据之间的 t 检验的 cohen-d,并且我在 python 中使用 pingouin 库。
如果我使用 pingouin.ttest(times0, times1,paired = True),它会给出 cohen-d = 0.395。
如果我创建 deltatimes = times1 - times0,并与 0 相比对一个样本进行 t 检验:pingouin.ttest(deltatimes, 0),它应该给出相同的结果,但它给出 cohen-d = 0.96。

知道为什么吗?

谢谢 !