问题标签 [kurtosis]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
392 浏览

statistics - 与 SPSS 和 MS excel 相关的统计峰度

我正在使用 SPSS 作为我的数据集的统计分析工具。我对峰度概念和 SPSS 和 excel 生成的概念很少有疑问。请更正以下理解并跟进问题:

  1. 峰度作为分布中平均值周围的平坦度或峰度(驼峰)的度量。就分布尾部而言,它告诉数据集相对于正态分布是重尾还是轻尾。

  2. 正态分布的峰度正好为 3(过度峰度正好为 0,即 kurt-3),也称为中峰分布。峰度高的分布其峰值大于中峰峰,称为细峰分布 峰度低的分布峰小于中峰峰,称为扁峰。

问题:

  1. 过度峰度是什么意思,使用它的意义是什么?我不清楚峰度与过度峰度之间的关系,除了过度峰度是峰度 3,因此我们将 0 作为基线。

  2. SPSS 工具生成“过度峰度”值还是简单的“峰度”值?换句话说,我们在 SPSS 中通常考虑什么基线来进行峰度测量和推理?是0还是3?在 SPSS 中,我的峰度为 1.16。因此,如果我将 3 视为基线,则 1.16 小于 3,因此我的分布可能是 platykurtic。但如果我将基线视为 0(过度峰态),那么 1.16 显然大于 0,因此我的分布可能是尖峰态。

  3. 它如何再次在excel中工作?excel公式内部计算峰度为(kurt - 3)还是简单的kurt?我的意思是如何在 MS excel 中推断结果(基线 3 或 0)?

0 投票
1 回答
110 浏览

python - 计算数组中每个序列或区间的峰度

我有一个包含 1000(行)值的数组,我想按照数组的第一个值 0 到 999 的顺序为每 10 个值计算峰度。所以,最后,我会从列表中得到 100 个峰度值。然后我想把所有的峰度值放到一个列表中。变量无关紧要,只是我是Python新手,对它了解不多。感谢您的所有帮助。

0 投票
1 回答
27 浏览

kurtosis - Estimate the probability density of a given value if it belongs to a highly peaked multivariate dataset with high kurtosis (>100)

I have a dataset that have multiple variables with each of them heavily centered around zero to form a high peak. The kurtosis of each variable is more than 100.

What I want to estimate is the probability density of any given value if it belongs to the dataset. The most accessible distribution function I found currently is the multivariant Gaussian distribution. However, since my dataset is not is a normal shape and I am worried that it is inaccurate estimate the probability density using this function.

Does anyone have any good suggestions on which function to use to for this purpose?

0 投票
2 回答
740 浏览

r - 从分布函数估计矩

我有一个非正态分布函数,我想计算它的矩(均值、方差、偏度和峰度)。我知道的包是e1071计算moments离散值向量的矩。是否有一个包可以估计连续分布函数的矩?作为一个例子,假设我有这个分布:

现在我想计算:

在此处输入图像描述

0 投票
2 回答
2309 浏览

r - 如何扩展“摘要”功能以包括 sd、峰度和偏斜?

R 的summary函数在数据帧上运行得非常好,例如:

我想做的是修改函数,因此它还在“平均值”之后给出标准偏差、峰度和偏斜的条目。

最好的方法是什么?我对此进行了一些研究,并且使用方法添加函数对我不起作用:

以上只是忽略。我想我需要了解如何定义所有要返回的类。

0 投票
1 回答
75 浏览

r - 使用循环找到 P(-1.5

我从 R 中的标准正态分布创建了一个大小为 n=20 的 iid 随机样本。我有一个 m=10^5 场景的蒙特卡罗模拟。我试图找出样本的过度峰度介于 -1.5 和 1.5 之间的概率。到目前为止,我有这个代码:

但是,现在我想将样本大小更改为 n=10 和 n=200 之间的值范围,以显示随着样本大小的增加,更多值介于 -1.5 和 1.5 之间。所以我想在 10,20,30,40....200 处计算 Z(1.5)-Z(-1.5) (记住 m=10^5)(我最终用更大的样本量证明了这一点, 过度峰态趋向于零的标准正态) 我如何使用循环或不同的方法来做到这一点?任何建议,将不胜感激。


将此处的整个代码添加到您的 php 片段插件中,感谢@kacholo,它会像魅力一样工作

0 投票
1 回答
329 浏览

python - 如何计算已分箱数据的峰度?

有谁知道如何使用 Python 单独从分箱数据计算分布的峰度?

我有一个分布的直方图,但没有原始数据。有两列;一个带有 bin 编号,一个带有计数编号。我需要计算分布的峰度。

如果我有原始数据,我可以使用 scipy 函数来计算峰度。我在本文档中看不到任何使用分箱数据进行计算的内容。 https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.kurtosis.html

scipy 的 binned statistics 选项允许您计算 bin 内的峰度,但仅使用原始数据且仅在 bin 内。 https://docs.scipy.org/doc/scipy-0.16.0/reference/generated/scipy.stats.binned_statistic.html

编辑:示例数据。我可以尝试从中重新采样以创建我自己的虚拟原始数据,但我每天要运行大约 140k 的这些数据,并且希望有一些内置的东西。

0 投票
1 回答
987 浏览

postgresql - plpgsql 用于计算偏度和峰度的 Postgresql 函数

我正在搜索 Postgresql plpgsql 函数来计算“偏度”和“峰度”描述性统计函数,但我找不到任何函数。如果有人可以在这里分享这样的 plpgsql 函数,那就太好了。谢谢!

0 投票
0 回答
382 浏览

r - 如何使用 R 中的 MASS 库包修复“找不到对象”?

我试图在 MASS 数据库中找到变量星系的偏度

我已经概述了偏度的公式,然后加载了 MASS 包,定义了星系数据集,但是由于偏度公式中未定义 n,因此出现错误。我不确定是否需要包含一个 n,因为我只希望我的样本量是星系中的所有结果。

我的代码是

myskewness(gal) 中的错误:找不到对象“n”

0 投票
0 回答
258 浏览

r - R 使用同一个库给出的不同时刻

R与库一起使用moments来生成一个小数据集并计算我的数据的四个初始时刻:

  1. 意思是
  2. 变化
  3. 偏度
  4. 峰态

代码如下所示。我为我的 PRNG 设置了一个随机种子,并使用正态分布生成 1000 个数据点。
然后,我以两种方式打印四个时刻。首先,我单独打印。然后,我使用all.moments方法打印它们。

输出如下所示。


人们可能会注意到,两种方法的偏度和峰度都是不同的。

我的问题是:为什么他们给出不同的结果?哪个结果是正确的?