问题标签 [pingouin]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 从 pearson 相关数据中提取 r 值
我正在使用 pingouin stat 包来查找两组数据之间的相关性,然后我想检查这种相关性是否很强。但是,我得到 5-6 个输出值,其中只有一个是r
. 如何r
从输出数据中获取?
代码:
输出:
python - pg.pairwise_corr 错误:x 和 y 必须是一维数组
尝试使用 pg.pairwise_corr 方法出现以下错误:
pg.pairwise_corr(df)
我尝试使用该功能,只选择这样的一列
pg.pairwise_corr(df, columns='col')
并得到同样的错误。
事实上,我的数据框的所有列都具有相同的长度。(而且对于另一个数据框来说它工作得很好)。但是我使用 pd.concat 方法连接了一些文件,但是当对象最终是 data.frame 时,这应该无关紧要吗?
感谢您的建议!
python - 大型数据集上的 Pearsonr 和 pvalues,包括空值
我有约 375 个细胞系和约 14,000 个基因的数据文件。我正在尝试计算每个基因与其他所有基因的成对相关性。
代码非常简单,因为我使用的是 pingouin 包:
尝试运行此代码返回:
Pingouin 使用 Scipy pearsonr 进行计算,使用不带 Pingouin 的 pearsonr 返回相同的错误。
我还尝试使用虚拟数据集(随机数的 5x7 数据帧),它在不包含任何空值时工作正常,但如果数据帧中存在空值,则返回相同的错误。基于此,我认为我的数据集中的空值导致了问题 - 不幸的是,数据参差不齐,删除包含空值的所有行/列会使我没有留下任何行/列,并且在虚拟数据集中甚至一个 NaN值足以引发错误。由于 rcorr 在输入 pearsonr 之前删除了 NaN 值,我相信它会丢弃我所有的数据点并且没有任何东西可以输入。
df.corr 可以很好地计算我的 r 值,但我也需要一种方法来计算该数据集的 p 值,因为我们预计这些相关性中有很大一部分是微不足道的。
有没有一种方法可以在我的数据集中删除/屏蔽 NaN 值而不删除整个行/列?有没有办法运行 pearsonr,其行为类似于带有 (nan_policy:'omit') 的 spearmanr?我是否偏离了基地,这里的问题不是 NaN 值吗?
python - 皮尔逊相关的功效分析
Pingouin 提供了惊人的输出,其中也包括功率。
这是 github 页面:https ://github.com/raphaelvallat/pingouin/blob/master/notebooks/04_Correlations.ipynb
但我找不到他们如何在代码中计算功率。
最好的,
python - pingouin.rm_anova,重复测量方差分析错误。蟒蛇,熊猫
我想使用 pingouin rm_anova 重复测量 anova。我的数据是长格式的,有不同的时间点(时间),每个id是一个主题,每个主题在3个不同的时间点重复3次。DV 是 weight_loss,IVs 是组和时间。数据如下所示:
这是我的代码:
但我收到这样的错误消息:
我尝试了 'within' variable = ['time'] 并且它有效,但它不适用于单独的 ['group'] 变量或组合。我还检查了 NA,没有 NA 也没有 0。有谁知道出了什么问题以及如何解决?
先感谢您!
dataframe - DataFrame 到 DataFrameRow 的转换 (Julia)
我Pingouin.jl
用来测试正常性。
在他们的文档中,我们有
哪个应该返回DataFrame
正常性true
或数据集中false
的每个name
。
目前,此广播已被弃用,我无法将每个唯一列输出(正在工作并输出一个 DataFrame)的结果连接到一个 DataFrame 中。
所以,到目前为止我所拥有的。
我得到的错误:
编辑:push!
在我的第一个版本的帖子中没有正确编写函数。但是,更改后错误仍然存在。如何将DataFrame
Pingouin 的类型输出重新格式化为DataFrameRow
?
python - Python Pingouin 2 路不平衡方差分析
尝试使用 Pingouin 进行 2 路不平衡方差分析并获得 KeyError。这是我的一些代码,其中data_rostral
是我的数据框,param
是我之前定义的变量。
当我运行它时,它会给出如下所示的 KeyError -
其中totalcells
是由 param 定义的列之一的标题。
我尝试重新运行它并设置dv=totalcells
,以为我会一个一个地做一堆方差分析,而不是使用变量参数,但我得到了完全相同的错误。我在同一个 colab 笔记本中的混合 ANOVA 上使用变量 param 没有问题,所以我不认为是这样,除非 2 路不平衡的语法只是不同到足以使其无法工作。我查看了其他有类似问题的线程,但仍然无法弄清楚。
TIA。我是一个非常新手的编码器,感谢所有更正和建议!
python - Pingouin 混合方差分析未报告温室-盖瑟校正的 p 值
我正在使用 Pingouin 运行混合模型 anova,但我无法让它报告 Greenhouse-Geisser 校正的 p 值
我的数据结构如下:
用户身份 | 团体 | test_id | avg_payment | 多变的 | 价值 | 健康)状况 |
---|---|---|---|---|---|---|
21000010749909 | 控制 | 1 | 0 | avg_daily_net_rev | 0 | 前 |
21000021190553 | 控制 | 1 | 0-9 | avg_daily_net_rev | 80 | 前 |
21000021497845 | 控制 | 1 | 9-40 | avg_daily_net_rev | 48 | 前 |
21000020054046 | 测试 | 1 | 40-80 | avg_daily_net_rev | 14 | 前 |
21000021354449 | 控制 | 1 | 80-100 | avg_daily_net_rev | 7 | 前 |
21000010749909 | 控制 | 1 | 0 | avg_daily_net_rev | 0 | 后 |
21000021190553 | 控制 | 1 | 0-9 | avg_daily_net_rev | 76 | 后 |
21000021497845 | 控制 | 1 | 9-40 | avg_daily_net_rev | 30 | 后 |
21000020054046 | 测试 | 1 | 40-80 | avg_daily_net_rev | 48 | 后 |
21000021354449 | 控制 | 1 | 80-100 | avg_daily_net_rev | 71 | 后 |
我的代码是这样的
我究竟做错了什么?
谢谢
python - ImportError:无法使用 Pingouin 从 scipy.stats 导入模块
此问题出现在本地 Jupyter 笔记本中,我使用的是 Python 3.10
导入scipy
并scipy.stats
没有问题。
但是,我正在尝试使用 Pingouin 库进行数据分析并遇到以下代码的问题:
由于 Pingouin 依赖于 SciPy,因此它会尝试导入所需的模块并至少卡在一个模块上。我已尝试卸载并重新安装 SciPy 和 Pingouin,但无法解决此问题。任何意见是极大的赞赏!
python - Cohen-d 与 pingouin 测试函数、配对样本有关的问题
我有两个时间值列表,“times0”和“times1”。
数据是配对的(times0 中的第一个值与 times1 中的第一个值配对,第二个值同上等)。我想要这些数据之间的 t 检验的 cohen-d,并且我在 python 中使用 pingouin 库。
如果我使用 pingouin.ttest(times0, times1,paired = True),它会给出 cohen-d = 0.395。
如果我创建 deltatimes = times1 - times0,并与 0 相比对一个样本进行 t 检验:pingouin.ttest(deltatimes, 0),它应该给出相同的结果,但它给出 cohen-d = 0.96。
知道为什么吗?
谢谢 !