问题标签 [kurtosis]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
394 浏览

matlab - 如何在 Matlab 中生成具有给定偏度、峰度、均值和标准差的分布?

我需要创建一些具有给定偏度、峰度、均值和标准偏差的分布。我通过这样做生成了一个正态分布:

有谁知道我怎样才能改变偏度和峰度?

我刚刚在网上找到了这个,它似乎有点诀窍:

例如

有什么方法可以控制均值和标准差?Tnx

谢谢大家

0 投票
3 回答
2031 浏览

r - 在R中按年份计算偏斜和峰度

我有一个看起来像这样的表:

(“天”列不参与我的偏斜峰度计算,它只是在我的表中)

我想要一个计算按年份分组的偏斜和峰度值的表:

我不知道如何按年份对其进行分组以执行这些计算。

0 投票
1 回答
244 浏览

python - 如何计算描述性统计;从数据集中选择特征的偏度和峰度?

我需要在 python 中正确地从数据框中找到所选特征的偏度和峰度。

目标(y)特征是我需要的选定特征。

块引用

0 投票
1 回答
642 浏览

python - 使用 for 循环计算峰度和偏度

我正在尝试计算不同领域的偏斜度和峰度。我想用每个字段名进入最终表。峰度和偏度。为此,我编写了下一个代码:

AttributeError:“str”对象没有属性“skew”

从信息中可以看出,我 100% 确定我的数据库中没有字符串:

我在这里看到了歪斜:http: //www.christianherta.de/lehre/dataScience/exploratory/intro-explorative-data-analysis.php

我的最终目标是创建一个包含每个字段的偏度和峰度数据的表。

0 投票
1 回答
125 浏览

python - 图表上显示峰度和偏度的错误

我在这个论坛中发现了一个代码,它假设计算并在直方图上显示偏度和峰度。

这是我在情节中使用的代码:

但我得到了一个错误:

ValueError:基于位置的索引只能有[整数,整数切片(开始点包含,结束点排除),整数列表,布尔数组]类型

我知道这里的问题是位置,可能是代码中写有 iloc 的部分,但我不知道如何解决它,我刚刚开始使用 python,所以解释越广泛,我遇到的问题就越少。 ..

我的最终目标是调整这些图表上的峰度和偏度

0 投票
1 回答
33 浏览

python - 仅在表格的一部分上进行计算

我正在尝试计算数据的峰度和偏度,并且我设法创建表,但由于某种原因,结果仅适用于少数列,而不适用于整个字段。

例如,如您所见,我有很多字段(列): 在此处输入图像描述

我使用下面的代码计算 skenwess 和峰度:

但随后我得到的结果包含大约一半的数据:

在此处输入图像描述

我试图做 head(10) 但它并没有改变一些列消失的事实。

我怎样才能为所有列计算这个?

0 投票
2 回答
38 浏览

r - R - 基于使用另一列的函数为一列添加值

我有一个看起来像这样的数据集

头部(数据集)

我想向峰度列添加值。要计算峰度,我需要按延迟时间对距离进行分组(即,延迟时间 1 的所有距离都会给我一个峰度值等)。为了得到峰度,我通常使用包“psych”和函数 describe() 有没有我可以添加的循环来做到这一点?

0 投票
1 回答
187 浏览

pyspark - 使用 pyspark 模块中的函数时峰度是否过高?

使用 pyspark 模块中的峰度函数时pyspark.sql.functions.kurtosis(col),结果是否超过正态分布?IE。是否已经从峰度中减去 3 以产生 k-3?还是我们必须自己计算超出部分?

0 投票
2 回答
1145 浏览

numpy - 在 Python 中计算加权统计矩

我一直在寻找一个函数或包,它可以让我以加权方式计算分布的偏斜和峰度,因为我有直方图数据。

例如我有数据

其中第一列[1,2,3,4,5]是值,第二列[2,5,6,12,1]是值的频率。

我已经发现如何使用此线程weighted_avg_and_std中指定的函数以加权方式计算前两个时刻(均值、标准差) ,但我不太确定如何将其扩展到偏斜和峰度,甚至第 n 个统计时刻。

我在这里找到了定义本身,并且可以手动编写函数来从头开始实现它,但在我开始这样做之前,我想知道是否有任何现有的包或函数可以做到这一点。

谢谢

编辑:我想通了,以下代码有效(请注意,这是用于人口时刻)

0 投票
1 回答
44 浏览

python - 峰度在不同形状的正态分布上保持不变?

我想探索具有相同均值但改变标准的正态分布。

我希望峰度会随着标准的变化而变化,但在我的结果中峰度保持不变?

这里有什么问题?

起初,我通过移动标准生成了一些正态分布:

nd_l_std_44 = {} for i in range(1,10): >> nd_std_44 = stats.norm.rvs(loc=0, scale=i, size=10000, random_state=5) >> nd_l_std_44["ndl_std_{i}" .format(i=i)] = nd_std_44 打印(nd_l_std_44.keys())

这行得通,我确实得到了一个每个键都有不同值的字典。

我确实绘制了结果分布:

在此处输入图像描述

我预料到了这一点。峰度不同,而平均值保持不变。现在我以多种方式计算峰度,例如使用 scipy.stats

kurt_std_1 = dict() for k,v in nd_l_std_44.items(): >> kurt_std_1[k] = stats.kurtosis(v, Fisher=False) print(kurt_std_1)

问题是,对于所有发行版,我确实得到了相同的峰度。熊猫也是如此。对于具有不同标准的分布,我预计会有显着不同的峰度值。相反,这些值在很大程度上是相等的。)

{ 'ndl_std_1': -0.0690005257753592, 'ndl_std_2': -0.0690005257753592, 'ndl_std_3': -0.0690005257753592, 'ndl_std_4': -0.0690005257753592, 'ndl_std_5': -0.06900052577535831, 'ndl_std_6': -0.0690005257753592, 'ndl_std_7': -0.06900052577535876, “ndl_std_8”:-0.0690005257753592,“ndl_std_9”:-0.0690005257753592 }

这里发生了什么?非常感谢您的帮助。