问题标签 [scipy.stats]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
99 浏览

python - 如何在 Python 中获得具有 SSR、SSE、SSTO 的标准 ANOVA 表?

我正在尝试使用以下代码获得额外/序列 SS 输出:

这是 Python 中的输出

我希望它看起来像标准 ANOVA 输出,如下所示(从 Minitab 获得)。有什么办法吗?

额外/序列 SS 的 Minitab 输出

0 投票
0 回答
551 浏览

python - python中的偏斜t分布

Pythonscipy.stats.t可以生成随机数rvsfit

如果没有,可以scipy.stats.t以某种方式修改为倾斜的 t?

0 投票
2 回答
606 浏览

python - 如何在两个 Pandas 数据帧中找到元素调和平均值

与这篇文章类似:在不同的 pandas 数据帧中找到调和平均值的有效函数我有两个形状相同的 Pandas 数据帧,我想找到每对元素的调和平均值——一个来自同一位置的每个数据帧。该帖子中给出的解决方案是使用面板,但现在已弃用。

如果我这样做:

我只得到一列值。为什么?根据原始 df,我期望有两列,一列用于 x 值的 hmean,另一列用于 y 值的 hmean。我怎样才能实现我想做的事情?

0 投票
1 回答
59 浏览

python - 如何从 Scipy 的 wasserstein_distance 中提取距离和传输矩阵?

scipy.stats.wasserstein_distance函数仅返回两个输入分布之间的最小距离(解)pq。但是该距离是距离矩阵和必须在同一函数内计算的最佳传输矩阵的乘积。

如何提取与解决方案相对应的距离矩阵和最佳传输矩阵作为第二和第三输出参数?

0 投票
0 回答
34 浏览

python - scipy.stats.wasserstein_distance 后面的代码中缺少传输矩阵

查看调用函数的代码的注释,它说这个函数实现了以下公式:scipy.stats.wasserstein_distance_cdf_distance(p, u_values, v_values, u_weights=None, v_weights=None)

l_p(u, v) = \left( \int_{-\infty}^{+\infty} |U-V|^p \right)^{1/p}

然而,这不是我所知道的 Wasserstein 距离,因为虽然我在上面的公式注释中看到了距离矩阵,但 传输矩阵明显不存在。传输矩阵应该与积分内的距离矩阵相乘。|U-V|

为什么缺少传输矩阵scipy.stats.wasserstein_distance

0 投票
1 回答
95 浏览

scipy - scipy.stats.lognorm.expect 返回一个奇怪的结果

我正在尝试使用 scipy.stats.expect 获取对数正态随机变量的 E(x)。

使用 fit() 模块,shape、loc 和 scale 参数为

期望值输出为

输出:0.20809733881415318

但是,当使用 pdf 图表手动计算时,该值更接近 0.5。以下图表:

在此处输入图像描述

你能解释一下我在哪里错了吗?

0 投票
1 回答
44 浏览

python-3.x - 使用 scipy.stats.rv_continuous 对分布进行子类化的溢出错误

在 rv_continuous 的文档页面中,我们可以找到一个“自定义”高斯被子类化如下。

反过来,我尝试为以 2 为底的指数分布创建一个类,以模拟一些核衰变:

这样做的目的是random_var.rvs()为了根据我定义的 pdf 生成随机分布的值样本。但是,当我运行它时,我收到一个 OverflowError,我不太明白为什么。最初我认为这与函数未标准化这一事实有关。但是,我一直对 _pdf 定义进行更改,但无济于事。代码有什么问题,还是这种方法不适合定义此类函数?

0 投票
1 回答
128 浏览

python - 从(叠加)分布创建不等间距的值

我想创建一个具有不等间距值的数组。间距应由(例如)具有不同平均值和宽度值的两个正态分布的叠加来确定。对于单个(正常)分布,我在这篇文章的帮助下设法得到了我想要的:python,weighted linspace

使用此代码:

我得到了我想要的单个分布的结果:

在此处输入图像描述

但是,对于两个正态分布的叠加,我需要完全相同,例如:

这是叠加分布的直方图的样子:

在此处输入图像描述

作为一个临时解决方案,我为每个发行版单独创建了数组并将它们添加在一起。但是,这并不是我想要的,因为添加两个单独的数组会导致添加的数组之间的步长波动(例如,来自两个不同(单独)数组的两个值可能几乎或完全相同)。

我还尝试定义一个从rv_continuous类继承的新分布scipy.stats,但我未能实现两个不同的均值/宽度参数。

我很确定它应该可以添加单独的概率密度函数,但不幸的是我也用这种方法失败了。

提前感谢您的任何帮助和/或评论!

0 投票
1 回答
5825 浏览

python - python scipy.stats 中的 norm.ppf 与 norm.cdf

所以我已经粘贴了我的完整代码供你参考,我想知道这里的ppf和cdf有什么用?你能解释一下吗?我做了一些研究,发现 ppf(百分点函数)是 CDF(计算分布函数)的倒数,如果它们真的是,如果我将 ppf 和 cdf 分别替换为 1/cdf 和 1/ppf,这段代码不应该工作吗?

请向我解释一下,两者之间的区别。以及如何以及何时使用 which

顺便说一句,这是假设检验。对这么多评论感到抱歉,只是习惯于解释一切以供我将来参考。(如果我的任何评论对此有误,请指出我)

0 投票
1 回答
146 浏览

python - 为什么 Johnson-SU 分布在 scipy.stats 中没有给出正偏度?

下面的代码映射了由Johnson - SU分布a(blocscalejohnsonsu

对于下面我的代码中指定的循环值范围,没有参数配置会导致正偏度,只有负偏度,即使应该可以将 Johnson-SU 分布参数化为正偏度。

打印的最小和最大时刻是:

与我在下面指定的相比,探索 、 和 参数的更好范围是a什么?文档只说并且必须是肯定的,没有关于什么和必须限制的内容。blocscaleablocscale