问题标签 [scipy.stats]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

208 问题

0 投票

1 回答

104 浏览

python - 尝试对 .csv 数据集进行 linregress 时，Scipy.stats 错误“要解压的值太多”

我正在尝试为我的实验数据拟合一条线。当我运行我通常使用的代码时，我得到了错误

回溯（最后一次调用）：文件“/home/h/oscillator1.py”，第 21 行，斜率，截距，r_value = scipy.stats.linregress(data) ValueError: too many values to unpack (expected 3)

这是我的代码：

感谢您提供任何帮助。

2020-10-16T11:13:52.820

0 投票

0 回答

66 浏览

statistics - Scipy stat（KS-test）分布与数据集的直方图不匹配

我有一个这样的数据集

该数据的相应直方图如下

我使用以下代码测试数据集以从 scipy stat KS 测试中获取实际参数（从如何找到真实数据的概率分布和参数？（Python 3））

结果表明，它的极值分布。结果如下图所示：

使用这些属性的拟合曲线如下

据我了解，直方图表明它是一个指数分布。但从 KS 测试它显示另一个。谁能解释为什么会发生这种情况或有什么问题？

statistics data-science distribution scipy.stats

2020-10-18T22:33:57.933

0 投票

0 回答

38 浏览

python - 子类化 scipy.stats.rv_continuous

我花了相当大的努力和搜索尝试子类scipy.stats.rv_continuous化以生成 Weibull 概率分布的新参数化 ( weibull_max)，但不明白应该如何完成。我正在尝试将分布设置为能够使用 pdf、cdf、随机变量和拟合方法。

我可以使用以下独立函数生成所需的 pdf：

有人会猜测以下应该可以工作：

但该pdf方法不会产生相同的结果。欢迎任何指点。

python scipy.stats

2020-10-26T00:34:14.747

0 投票

0 回答

100 浏览

python - 两个矩阵之间的 KL-Divergence 计算——快速 python 实现？

我有两个矩阵A：（nxm），B：（lxm），我想计算A和B之间每对行之间的KL散度，从而得到一个（nxl）矩阵。

我知道 scipy 有一个熵函数，但我不知道如何使用它来扩展和向量化矩阵之间的计算。

任何帮助表示赞赏！

python performance scipy vectorization scipy.stats

2020-10-30T07:56:16.020

0 投票

1 回答

367 浏览

python - 用 scipy 拟合具有固定均值的伽马分布？

scipy.stats.rv_continuous.fit允许您在拟合分布时修复参数，但这取决于 scipy 对参数化的选择。对于 gamma 分布，它使用 k、theta（形状、比例）参数化，因此例如在保持 theta 常数的情况下很容易拟合。我想拟合一个我知道平均值的数据集，但观察到的平均值可能会因抽样误差而有所不同。如果 scipy 使用使用 mu = k*theta 而不是 theta 的参数化，这将很容易。有没有办法让 scipy 做到这一点？如果没有，是否有另一个图书馆可以？

下面是一些示例代码，其中数据集的观测平均值为 9.952，但我知道基础分布的实际平均值为 11：

这给了

但我想要一个合适的shape*scale = 11.0

python scipy scipy.stats

2020-11-03T03:05:23.837

0 投票

1 回答

168 浏览

python - 我可以对训练和测试数据使用假设检验吗？

我想知道在拆分数据集后是否可以对训练和测试数据使用假设测试。

我的目标是检查两个数据样本组是否平衡、分布良好，因此将为要应用的 ML 模型提供一个很好的环境。

如果是这样，我希望 H0（零假设）被接受，即我希望测试数据是训练数据的“缩影”

或者

我希望 H1（替代假设）被接受，即为了检查我的 ML 环境的“基础”，我应该期望找到两个样本之间的差异？

假设我的数据点有 1000 多个数据点，它们遵循高斯分布并且是独立的，那么 Z 检验会是一个好策略吗？

python scikit-learn hypothesis-test scipy.stats

2020-11-03T17:20:43.950

0 投票

1 回答

545 浏览

python-3.x - python中两个数据帧之间的Wilcoxon秩和检验

我正在尝试在两个数据帧之间执行 Wilcoxon 秩和检验。我想只在行之间执行测试。例如，测试只能在 df1 (A, 1, 2, 3) 和 df2 (A ,10, 12 ,13) 中的第 1 行，df1 (B ,4, 5, 6) 和 df2 中的第 2 行之间进行(B ,14, 15, 16) 等等。

这应该让我找到一列 p 值，用于数据框行之间的测试。

一种方法是应用 for 循环，但不幸的是，我的原始数据集中有 28000 行，这个实验必须重复至少 1000 次。我想知道是否有人有更好的策略来解决这个问题。非常感谢您提前提供的帮助。

python-3.x pandas numpy statistics scipy.stats

2020-11-03T19:31:10.310

0 投票

1 回答

659 浏览

python - scipy.stats.gamma 库中的参数 a 是什么

我正在尝试使用 Gamma CDF 拟合，scipy.stats.gamma但我不知道a参数到底是什么以及如何计算位置和比例参数。不同的文献给出了不同的计算方法，这非常令人沮丧。我正在使用下面的代码，它没有给出正确的 CDF。提前致谢。

python gamma-distribution scipy.stats

2020-11-08T16:42:10.033

0 投票

0 回答

42 浏览

python - 为什么从 numpy.random 和 scipy.stats 随机生成的分布如此不同以至于它们的概率不能正确求和？

使用numpy.random包随机生成随机数时scipy.stats，为什么前一个包生成的直方图（总概率）有这么大的值，最大值接近4，而后者的直方图更合理，最大值远小于1 .

概率分布应该只总和为 1，并且没有单个概率超过 1。即使scipy生成器看起来更温和，它仍然不等于 1。我怎样才能使两个生成器从numpy.random并scipy.stats以相同的方式运行，即没有单个概率超过最大值 1？

除了绘图之外，单次运行的输出显示随机生成的向量的总和大相径庭：

python numpy statistics probability-distribution scipy.stats

2020-11-18T02:43:30.000

0 投票

1 回答

105 浏览

python - 傅里叶变换和全宽半最大值

我正在尝试计算三个μ子极化信号的傅里叶变换，它们只是余弦函数乘以指数衰减。因此，进行傅里叶变换，我们将看到以相应频率为中心的加宽峰。问题是我已经尝试过傅里叶变换，但我不知道它是否正确；此外，我正在尝试使用 scipy.stats.moment 函数，使用第二个时刻来计算 FWHM：它正确吗？你能告诉我代码是否正确吗？我将三个信号放在 .npy 文件中，以及用于傅里叶分析的代码。信号是signal[0]、signal[1]和signal[2]，10维数组。每个信号[k] 包含 10 个极化函数（每个施加磁场 1 个），它们是 400 个点的信号。 https://github.com/JonathanFrassineti/UNDI-examples。啊，频率范围从 0 Hz 到 40 MHz。谢谢！

python numpy scipy fft scipy.stats

2020-11-20T08:53:11.780

1 2 3 4 5 6 7 8 9 10

问题标签 [scipy.stats]

Reference