问题标签 [scipy.stats]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
104 浏览

python - 尝试对 .csv 数据集进行 linregress 时,Scipy.stats 错误“要解压的值太多”

我正在尝试为我的实验数据拟合一条线。当我运行我通常使用的代码时,我得到了错误

回溯(最后一次调用):文件“/home/h/oscillator1.py”,第 21 行,斜率,截距,r_value = scipy.stats.linregress(data) ValueError: too many values to unpack (expected 3)

这是我的代码:

感谢您提供任何帮助。

0 投票
0 回答
66 浏览

statistics - Scipy stat(KS-test)分布与数据集的直方图不匹配

我有一个这样的数据集

该数据的相应直方图如下

在此处输入图像描述

我使用以下代码测试数据集以从 scipy stat KS 测试中获取实际参数(从如何找到真实数据的概率分布和参数?(Python 3)

结果表明,它的极值分布。结果如下图所示:

使用这些属性的拟合曲线如下 在此处输入图像描述

据我了解,直方图表明它是一个指数分布。但从 KS 测试它显示另一个。谁能解释为什么会发生这种情况或有什么问题?

0 投票
0 回答
38 浏览

python - 子类化 scipy.stats.rv_continuous

我花了相当大的努力和搜索尝试子类scipy.stats.rv_continuous化以生成 Weibull 概率分布的新参数化 ( weibull_max),但不明白应该如何完成。我正在尝试将分布设置为能够使用 pdf、cdf、随机变量和拟合方法。

我可以使用以下独立函数生成所需的 pdf:

有人会猜测以下应该可以工作:

但该pdf方法不会产生相同的结果。欢迎任何指点。

0 投票
0 回答
100 浏览

python - 两个矩阵之间的 KL-Divergence 计算——快速 python 实现?

我有两个矩阵A:(nxm),B:(lxm),我想计算A和B之间每对行之间的KL散度,从而得到一个(nxl)矩阵。

我知道 scipy 有一个熵函数,但我不知道如何使用它来扩展和向量化矩阵之间的计算。

任何帮助表示赞赏!

0 投票
1 回答
367 浏览

python - 用 scipy 拟合具有固定均值的伽马分布?

scipy.stats.rv_continuous.fit允许您在拟合分布时修复参数,但这取决于 scipy 对参数化的选择。对于 gamma 分布,它使用 k、theta(形状、比例)参数化,因此例如在保持 theta 常数的情况下很容易拟合。我想拟合一个我知道平均值的数据集,但观察到的平均值可能会因抽样误差而有所不同。如果 scipy 使用使用 mu = k*theta 而不是 theta 的参数化,这将很容易。有没有办法让 scipy 做到这一点?如果没有,是否有另一个图书馆可以?

下面是一些示例代码,其中数据集的观测平均值为 9.952,但我知道基础分布的实际平均值为 11:

这给了

但我想要一个合适的shape*scale = 11.0

0 投票
1 回答
168 浏览

python - 我可以对训练和测试数据使用假设检验吗?

我想知道在拆分数据集后是否可以对训练和测试数据使用假设测试。

我的目标是检查两个数据样本组是否平衡、分布良好,因此将为要应用的 ML 模型提供一个很好的环境。

如果是这样,我希望 H0(零假设)被接受,即我希望测试数据是训练数据的“缩影”

或者

我希望 H1(替代假设)被接受,即为了检查我的 ML 环境的“基础”,我应该期望找到两个样本之间的差异?

假设我的数据点有 1000 多个数据点,它们遵循高斯分布并且是独立的,那么 Z 检验会是一个好策略吗?

0 投票
1 回答
545 浏览

python-3.x - python中两个数据帧之间的Wilcoxon秩和检验

我正在尝试在两个数据帧之间执行 Wilcoxon 秩和检验。我想只在行之间执行测试。例如,测试只能在 df1 (A, 1, 2, 3) 和 df2 (A ,10, 12 ,13) 中的第 1 行,df1 (B ,4, 5, 6) 和 df2 中的第 2 行之间进行(B ,14, 15, 16) 等等。

这应该让我找到一列 p 值,用于数据框行之间的测试。

一种方法是应用 for 循环,但不幸的是,我的原始数据集中有 28000 行,这个实验必须重复至少 1000 次。我想知道是否有人有更好的策略来解决这个问题。非常感谢您提前提供的帮助。

0 投票
1 回答
659 浏览

python - scipy.stats.gamma 库中的参数 a 是什么

我正在尝试使用 Gamma CDF 拟合,scipy.stats.gamma但我不知道a参数到底是什么以及如何计算位置和比例参数。不同的文献给出了不同的计算方法,这非常令人沮丧。我正在使用下面的代码,它没有给出正确的 CDF。提前致谢。

0 投票
0 回答
42 浏览

python - 为什么从 numpy.random 和 scipy.stats 随机生成的分布如此不同以至于它们的概率不能正确求和?

使用numpy.random包随机生成随机数时scipy.stats,为什么前一个包生成的直方图(总概率)有这么大的值,最大值接近4,而后者的直方图更合理,最大值远小于1 .

在此处输入图像描述

概率分布应该只总和为 1,并且没有单个概率超过 1。即使scipy生成器看起来更温和,它仍然不等于 1。我怎样才能使两个生成器从numpy.randomscipy.stats以相同的方式运行,即没有单个概率超过最大值 1?

除了绘图之外,单次运行的输出显示随机生成的向量的总和大相径庭:

0 投票
1 回答
105 浏览

python - 傅里叶变换和全宽半最大值

我正在尝试计算三个μ子极化信号的傅里叶变换,它们只是余弦函数乘以指数衰减。因此,进行傅里叶变换,我们将看到以相应频率为中心的加宽峰。问题是我已经尝试过傅里叶变换,但我不知道它是否正确;此外,我正在尝试使用 scipy.stats.moment 函数,使用第二个时刻来计算 FWHM:它正确吗?你能告诉我代码是否正确吗?我将三个信号放在 .npy 文件中,以及用于傅里叶分析的代码。信号是signal[0]、signal[1]和signal[2],10维数组。每个信号[k] 包含 10 个极化函数(每个施加磁场 1 个),它们是 400 个点的信号。 https://github.com/JonathanFrassineti/UNDI-examples。啊,频率范围从 0 Hz 到 40 MHz。谢谢!