问题标签 [scipy.stats]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
9368 浏览

python - norm.fit 在 scipy 中有什么意义?

我生成一个随机数据样本并使用 scipy.stats.norm.fit 绘制其 pdf 以生成我的 loc 和 scale 参数。

我想看看如果我只是使用 numpy 计算平均值和标准值而没有任何实际拟合,我的 pdf 看起来会有多么不同。令我惊讶的是,当我绘制两个 pdf 并打印两组 mu 和 std 时,我得到的结果完全相同。所以我的问题是,如果我可以计算样本的均值和标准值并且仍然得到相同的结果,那么 norm.fit 的意义何在?

这是我的代码:

这是我得到的结果:

一组随机值的pdf

mu1 = 0.034824979915482716

标准 1 = 0.9945453455908072

0 投票
2 回答
297 浏览

python-3.x - 根据 Python 中的给定方程模拟股票价格

如何使用以下等式生成价格时间序列:

p(t) = p0(1+A * sin(ωt +0.5η(t)))

其中t1000 个时间步长范围内从01 , p0 = 100A = 0.1ω = 100η(t)是具有零均值单位方差的iid 高斯随机变量序列。

我已经使用如下代码生成价格,但似乎不是必需的。所以我需要社区的帮助。提前致谢。

0 投票
1 回答
2108 浏览

python - Python中的幂律分布拟合

我正在使用不同的 python 来拟合数据集上的密度函数。该数据集由从 1 秒开始的正时间值组成。

我测试了来自库的不同密度函数,scipy.statistics以及powerlaw使用scipy.optimize's function 的我自己的函数curve_fit()

到目前为止,我在拟合以下“修改的”幂律函数时获得了最好的结果:

我的代码如下:

对于 x0,拟合返回值 8.48,对于 alpha,返回值 1.40。在 loglog 图中,数据和拟合图如下所示:

阴谋

  • 我的第一个问题是技术性的。为什么在函数中将opt.curve_fit(x+x0) 更改为 (x-x0) 时会出现以下警告和错误funct?由于我的 x0 界限是 (-inf, +inf),我期待拟合返回 -8.48。

/anaconda3/lib/python3.7/site-packages/ipykernel_launcher.py:3: RuntimeWarning: 除以零倒数遇到这与 ipykernel 包是分开的,所以我们可以避免导入直到 ValueError: Residuals are not limited in the initial观点。

  • 我的其他问题是理论上的。(x+x0)^(-alpha) 是标准分布吗?x0值代表什么,这个8.48s值如何物理解释?据我了解,这意味着我的分布对应于移动的幂律分布?我可以认为 x0 对应于将数据拟合到幂律时通常需要的 xmin 值吗?
  • 关于这个 xmin 值,我知道在拟合过程中只考虑大于这个阈值的数据来表征分布的尾部是有意义的。但是,我想知道用 xmin 之后的幂律和 xmin 之前的其他东西来表征完整数据的标准方法是什么。

这是很多问题,因为我对这个主题非常不熟悉,任何评论和回答,即使是部分的,将不胜感激!

0 投票
1 回答
3061 浏览

python - 在python中计算优势比

在此处此处在线查看我看到有两种方法可以在 python 中估计优势比,但结果不同。

第一种方式:

第二种方式:

第一种方法返回优势比=9,第二种方法返回优势比=1.9。我对优势比的概念相对较新,我不确定如何使用费希尔检验和逻辑回归来获得相同的值,有什么区别以及哪种方法是在这种情况下获得优势比的正确方法。我会很感激任何提示。谢谢。

0 投票
1 回答
250 浏览

python - t 测试为两者获取 nan 输出

我运行的每个 t 测试都输出 nan 的统计量和 p 值我检查了我的数据框,它们看起来很好。有谁知道发生了什么?提前致谢!

输出:Ttest_indResult(statistic=nan, pvalue=nan)

0 投票
0 回答
40 浏览

python - 多列分布拟合

我正在尝试使用scipy.stats获取数据的分布拟合。col_1, col_2, col_3数据在单个 CSV 文件中包含多个列。

  • 问题是分布拟合只需要一列来识别最佳分布拟合,如下面的代码所示。
  • 如何同时获得所有列的分布拟合?例如分布拟合col_1, col_2, col_3

    /li>
0 投票
1 回答
266 浏览

python - 显示特定直方图(不正常)

我正在尝试将具有特定 a 和 b 参数的截断正态分布覆盖在从相同分布生成的样本直方图上。

我如何适应 truncnorm(a,b) 的 pdf?这就是它现在的样子

0 投票
1 回答
657 浏览

python - python中参数未知的单样本Cramer-VonMises测试

我正在为python 中具有未知参数的正态分布寻找一个样本 Cramer-Von Mises 测试。

我在这里找到了一些讨论 https://github.com/chrisb83/scipy/commit/9274d22fc1ca7ce40596b01322be84c81352899d 但这似乎没有发布?

还有这个: https ://pypi.org/project/scikit-gof/ 但这些测试仅适用于完全指定的分布(即已知参数)。

有谁知道 python 中的 CVM 测试实现,用于具有未知参数的普通 dist?

谢谢

0 投票
1 回答
98 浏览

scipy - 评估分布拟合的优度

我使用以下代码为示例数据拟合了一些分布:

如何自动将图例中的分布名称从最佳拟合(顶部)排序到最差拟合?我在循环中生成了随机变量,每次迭代的最佳拟合结果可能不同。

0 投票
1 回答
151 浏览

python - 为什么 scipy.stats.gamma.pdf 返回一个 0 数组?

我正在尝试绘制大量数据并确定其分布方式,我很容易根据直方图绘制正态分布和 Beta 分布。

直方图和密度图。具有正态分布和 beta 分布。

但是,当我尝试对伽玛分布做同样的事情时,它只会返回一个大部分为零的数组。我的代码如下所示。

有谁知道我犯的错误?