问题标签 [kurtosis]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
statistics - 与 SPSS 和 MS excel 相关的统计峰度
我正在使用 SPSS 作为我的数据集的统计分析工具。我对峰度概念和 SPSS 和 excel 生成的概念很少有疑问。请更正以下理解并跟进问题:
峰度作为分布中平均值周围的平坦度或峰度(驼峰)的度量。就分布尾部而言,它告诉数据集相对于正态分布是重尾还是轻尾。
正态分布的峰度正好为 3(过度峰度正好为 0,即 kurt-3),也称为中峰分布。峰度高的分布其峰值大于中峰峰,称为细峰分布 峰度低的分布峰小于中峰峰,称为扁峰。
问题:
过度峰度是什么意思,使用它的意义是什么?我不清楚峰度与过度峰度之间的关系,除了过度峰度是峰度 3,因此我们将 0 作为基线。
SPSS 工具生成“过度峰度”值还是简单的“峰度”值?换句话说,我们在 SPSS 中通常考虑什么基线来进行峰度测量和推理?是0还是3?在 SPSS 中,我的峰度为 1.16。因此,如果我将 3 视为基线,则 1.16 小于 3,因此我的分布可能是 platykurtic。但如果我将基线视为 0(过度峰态),那么 1.16 显然大于 0,因此我的分布可能是尖峰态。
它如何再次在excel中工作?excel公式内部计算峰度为(kurt - 3)还是简单的kurt?我的意思是如何在 MS excel 中推断结果(基线 3 或 0)?
python - 计算数组中每个序列或区间的峰度
我有一个包含 1000(行)值的数组,我想按照数组的第一个值 0 到 999 的顺序为每 10 个值计算峰度。所以,最后,我会从列表中得到 100 个峰度值。然后我想把所有的峰度值放到一个列表中。变量无关紧要,只是我是Python新手,对它了解不多。感谢您的所有帮助。
kurtosis - Estimate the probability density of a given value if it belongs to a highly peaked multivariate dataset with high kurtosis (>100)
I have a dataset that have multiple variables with each of them heavily centered around zero to form a high peak. The kurtosis of each variable is more than 100.
What I want to estimate is the probability density of any given value if it belongs to the dataset. The most accessible distribution function I found currently is the multivariant Gaussian distribution. However, since my dataset is not is a normal shape and I am worried that it is inaccurate estimate the probability density using this function.
Does anyone have any good suggestions on which function to use to for this purpose?
r - 如何扩展“摘要”功能以包括 sd、峰度和偏斜?
R 的summary
函数在数据帧上运行得非常好,例如:
我想做的是修改函数,因此它还在“平均值”之后给出标准偏差、峰度和偏斜的条目。
最好的方法是什么?我对此进行了一些研究,并且使用方法添加函数对我不起作用:
以上只是忽略。我想我需要了解如何定义所有要返回的类。
python - 如何计算已分箱数据的峰度?
有谁知道如何使用 Python 单独从分箱数据计算分布的峰度?
我有一个分布的直方图,但没有原始数据。有两列;一个带有 bin 编号,一个带有计数编号。我需要计算分布的峰度。
如果我有原始数据,我可以使用 scipy 函数来计算峰度。我在本文档中看不到任何使用分箱数据进行计算的内容。 https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.kurtosis.html
scipy 的 binned statistics 选项允许您计算 bin 内的峰度,但仅使用原始数据且仅在 bin 内。 https://docs.scipy.org/doc/scipy-0.16.0/reference/generated/scipy.stats.binned_statistic.html
编辑:示例数据。我可以尝试从中重新采样以创建我自己的虚拟原始数据,但我每天要运行大约 140k 的这些数据,并且希望有一些内置的东西。
postgresql - plpgsql 用于计算偏度和峰度的 Postgresql 函数
我正在搜索 Postgresql plpgsql 函数来计算“偏度”和“峰度”描述性统计函数,但我找不到任何函数。如果有人可以在这里分享这样的 plpgsql 函数,那就太好了。谢谢!
r - 如何使用 R 中的 MASS 库包修复“找不到对象”?
我试图在 MASS 数据库中找到变量星系的偏度
我已经概述了偏度的公式,然后加载了 MASS 包,定义了星系数据集,但是由于偏度公式中未定义 n,因此出现错误。我不确定是否需要包含一个 n,因为我只希望我的样本量是星系中的所有结果。
我的代码是
myskewness(gal) 中的错误:找不到对象“n”
r - R 使用同一个库给出的不同时刻
我R
与库一起使用moments
来生成一个小数据集并计算我的数据的四个初始时刻:
- 意思是
- 变化
- 偏度
- 峰态
代码如下所示。我为我的 PRNG 设置了一个随机种子,并使用正态分布生成 1000 个数据点。
然后,我以两种方式打印四个时刻。首先,我单独打印。然后,我使用all.moments方法打印它们。
输出如下所示。
人们可能会注意到,两种方法的偏度和峰度都是不同的。
我的问题是:为什么他们给出不同的结果?哪个结果是正确的?